2026年3月17日凌晨,圣何塞SAP中心。两个半小时的演讲里,黄仁勋几乎用同一个词贯穿始终——Token。从底层芯片架构,到数据中心形态,再到商业模式设计,这个原本属于技术细节的概念,被他赋予了一个极具分量的定义:
“AI时代的硬通货。”
这个判断之所以震撼,是因为它彻底改变了Token的语义边界。大多数人对Token的认知,还停留在ChatGPT刚出现时的阶段:一个汉字约等于0.5个Token,和AI对话消耗多少Token就付多少钱——不过是一个计费单位。
但在黄仁勋的叙述中,Token不再是“计价标签”,而是被生产、被消耗、被交易的实体产品。
问题随之而来:谁在生产它?
答案是——数据中心。
如果说过去的数据中心更像一个“数字仓库”,企业租用机柜、购买带宽,本质是在租用存储与调用能力,那么在生成式AI时代,数据中心的角色已经发生质变。它不再只是存储信息,而是在持续“生产信息”。在这里,电力与数据作为原材料,经由GPU和推理芯片的运算,被转化为一个个Token输出。数据中心由此成为一种全新的存在——Token工厂。
这也意味着,评价一个数据中心的核心指标不再是“存了多少数据”,而是每瓦电力可以生成多少Token。产能由此被重新定义,竞争力则被压缩为一个极其冷酷的公式:每百万Token的生产成本。
这种变化的根源,在于计算范式的转移。过去几十年的互联网,本质上建立在“检索式计算”之上。用户发起请求,系统从数据库中调取已有信息返回结果,调用的是“存量知识”,边际成本极低。而生成式AI完全不同。无论是对话、写作、代码生成,还是智能体决策,每一次输出,都是在GPU上通过大规模矩阵运算“即时生成”的新信息。
换句话说,不再是“取”,而是“造”。
而“造”的成本,是实打实的算力与电力消耗。
需求的爆发,让这一体系迅速具备了经济学意义。黄仁勋在演讲中提到,推理需求在短短两年内增长了约10000倍。这个增长,并不只是用户数量上升,更关键的变量来自Agentic AI(智能体)的出现。过去的人机交互是一问一答,而现在,AI开始自主规划任务、调用工具、执行复杂流程。一个智能体完成任务所消耗的Token,往往是传统对话的100倍甚至1000倍。
每一个智能体,本质上都是一个持续运转的“Token消耗引擎”。
当需求指数级膨胀,Token自然开始具备“定价基础”。黄仁勋首次提出分层定价体系:从免费,到每百万Token约3美元、6美元、45美元,再到150美元的顶级层。价格差异背后,对应的是模型能力、响应速度与资源优先级的不同。
这套体系的关键不在价格本身,而在它彻底改写了软件行业的收费逻辑。
在SaaS时代,企业购买的是软件使用权,按席位、按模块付费,成本与算力消耗并无直接关系。而在Token经济中,AI服务的价格直接绑定“智能产出”。模型越大、上下文越长、响应越快,Token消耗越多,价格越高。企业收入模型也随之改变——不再是“卖软件”,而是“卖生成出来的Token”。
这也是为什么,像Adobe、Salesforce、SAP这样的企业软件巨头,开始全面接入英伟达的AI工具链。软件正在从“静态产品”,转变为“持续生成智能的过程”。客户付费的对象,不再是license,而是每一次真实发生的智能消耗。
如果说SaaS时代是“软件即服务”,那么Token时代更接近“智能即流量”。
而在中国,这一趋势同样被迅速验证。国家数据局局长刘烈宏公开表示,截至2026年3月,全国日均Token调用量已超过140万亿,较2024年初增长超过千倍。Token被明确定位为“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”。这一官方表述,实际上从宏观层面确认了Token的“准货币属性”。
从微观机制到宏观叙事,Token正在完成一场“身份跃迁”。
但要理解它为何能够成为“货币”,还需要回到技术本身。Token之所以成立,是因为它具备三个关键特征:可计量、可定价、可流通。无论是文本、图像还是视频,大模型都需要将其拆解为Token进行处理。一个句子可以被拆为若干Token,一张图片可以被切分为数百个视觉Token,一个视频甚至会被编码为三维Token块。Token因此成为AI处理世界的“最小原子”。
正因为所有计算都必须经过这一层拆解,Token天然具备统一计量的能力。而当厂商以Token计费,企业以Token核算成本,Token就不再只是技术单位,而成为了价值的通用尺度。
当然,这种“货币化”并非没有复杂性。不同模型的Token切分方式并不统一,存在明显的“汇率差”。同样一段1000字文本,在不同模型中可能被拆成800个或2500个Token,导致实际成本差异巨大。这意味着,Token更像是“平台内货币”,而非全球统一的标准货币。
但这并不妨碍它在各自生态中发挥核心作用。正如游戏币无法跨平台流通,却依然可以在单一系统内构建完整经济体系。
更深层的变化,是Token正在重塑整个产业链。从“Bit经营”到“Token经营”,不仅是计量单位的变化,更是商业逻辑的重构。以运营商为例,其角色正在从传统的“流量提供者”,转向“智能服务提供者”。通过整合算力、模型与场景,运营商可以直接销售Token服务,甚至构建统一Token池,向企业分发智能资源。
在这个体系中,Token不只是被消费,还被管理、调度、分配,成为企业内部精细化运营的核心指标。
但所有这一切,最终都指向一个更底层的约束:能源。
数据中心的电力与土地是刚性的。在1吉瓦功率不变的前提下,唯一的竞争变量,是“每瓦Token吞吐量”。黄仁勋展示的数据极具冲击力:同一座数据中心,仅通过升级架构,从Blackwell到Vera Rubin,再结合Groq的LPU芯片,年产出可以提升至原来的10倍。这种效率跃迁,使Token经济更接近工业生产,而非传统软件行业。
于是,一个极其直白的逻辑浮现出来:
谁能更低成本生产Token,谁就掌握定价权;谁掌握定价权,谁就接近“铸币权”。
这也是为什么英伟达的目标,被解读为成为“Token之王”。通过不断降低单Token成本,它不仅在卖芯片,更是在控制未来智能经济的底层生产力。
当然,隐忧同样存在。全球数据中心功耗逼近极限,Token生成速率却在指数级上升;Token一旦成为“基础货币”,其定价权、流通机制与监管框架仍未成形;而当智能体之间开始相互调用,Token需求可能远超当前所有预测。
这些问题尚无答案。但趋势已经足够清晰。
从粮食、黄金,到石油、数据,人类经济史本质上是一部“价值载体演化史”。每一次跃迁,都伴随着生产方式的改变与权力结构的重塑。
而今天,Token正在站上这个历史序列的下一个位置。
它既是AI处理世界的最小单位,也是衡量智能价值的统一尺度,更是连接技术与商业的结算语言。
当“算力就是收入”成为现实,当“没有Token就没有增长”成为企业共识,这个曾经隐匿在模型内部的技术词汇,已经完成了它的进化。
从代码里的一个参数,变成了AI时代的“硬通货”。