前几天,国家数据局局长刘烈宏在中国发展高层论坛上说了个数字:今年3月,中国日均Token调用量突破140万亿。两年前这个数还是1000亿。两年,一千多倍。
同一周,全球最大的AI模型API聚合平台OpenRouter的数据也出来了。3月16日到22日,全球AI大模型总调用量20.4万亿Token,中国一家占了7.359万亿,35%的盘子。连续三周,中国的周Token调用量压过美国。
Token是AI模型处理信息的最小计量单位,你可以把它想象成电表上跳动的数字。中国这块表,这两年跑得有点疯。

说起来,政策这只手一直在后面推着。2025年8月,国务院那份“人工智能+”行动意见,把2027、2030、2035三个节点钉得死死的。今年1月,工信部等八部门又发了个文,说到2027年要搞出1000个高水平工业智能体。再往前翻翻,3月的政府工作报告里,“打造智能经济新形态”这几个字第一次出现,明晃晃写着“促进新一代智能终端和智能体加快推广”。一套组合拳下来,路是给铺好了。
技术这边也没闲着。DeepSeek、MiniMax M2.5这些国产模型,把API使用成本硬生生打到地板价,性能倒是一点没含糊,有些地方甚至开始追上海外的闭源模型。开发者和企业一算账:便宜又好用,为什么不试试?
应用更是在往外冒。从OpenClaw那种能自己干活儿的AI智能体,到即梦AI Seedance 2.0带火的视频生成,一次互动的Token消耗量能顶过去十次百次。说到底,大家不是图新鲜,是图省事儿——能帮我干活的AI,谁不喜欢?
生态也在长。开源鸿蒙、开源欧拉打了地基,字节、百度、阿里、腾讯这些大户往里砸钱,再加上无数个人创作者和中小企业,把AI当工具使。微信、钉钉、飞书一铺开,十亿级用户全被拉进来。技术、钱、人,全拧到一起了。
但所有这些,都绕不开一样东西:算力。
Token是水,算力就是水管。水管不够粗、不够密,水流得再猛也出不去。
这两年算力这块地,动静不小。
北边,内蒙古的算力规模已经冲到了28万P,智算占了九成以上,绿电消费比例也过了八成。乌兰察布一个地方就攒了12.5万P,今年要奔20万P去;呼和浩特那边更猛,年底要干到50万P。目标就一个:让绿电算力往外送。
南边,昨天,中国移动在香港开了个环球智算中心。香港单体最大,能扛千亿级参数的大模型训练推理。五条粤港陆路通道、一百多条海陆缆、四百多个境外PoP点,全给它串起来。全国政协副主席梁振英在那天的会上说,这个中心要跟内地多个国家级算力枢纽互联互通,搞成“北算南联、东西贯通”的格局。
这还只是两个点。全国一体化算力网络,正在从纸面上往地上落。北方的绿电算力、西部的大集群、东部的枢纽、南方的出口,都在往一张网里装。
正是这张越织越密的网,给Token的爆发撑住了底气。
算力这玩意儿,不是越多越好,是得用得上、用着顺、用着便宜。各地算力能串起来,绿电算力能往东部送,成本降下来,Token才能跑得欢。2025年内蒙古算力产业营收577亿,涨了26.2%。这个数字和日均140万亿Token之间,隔着的是算力从资源变成生产力的转化效率。
站在“十五五”开头往回看,Token爆发不是终点。摩根大通掐指一算,中国AI推理Token消耗量要从2025年的10千万亿,涨到2030年的3900千万亿,五年翻370倍。
数字好看,坎也不少。量上去了,质能不能跟上?AI生成的版权问题怎么解?数据、技术、网络的安全体系怎么搭?这些事,最后可能都绕回到算力这张网上。
网越密,底气越足。Token每跳一次,都是在给这张网做一次压力测试。