中国AI调用量突然超过美国,英伟达股价崩了,这事儿真不是吹的。 我每天刷OpenRouter数据,就盯着那几条曲线看,上礼拜还只是涨,这礼拜直接跳——4.12T到5.16T,三周翻一倍多,连外国开发者都在猛用,93.99%是海外用户,美国那边占快一半,咱们自己人连十分之一都不到。 这数字不是靠刷出来的。我查了下,MiniMax的M2.5是2月13号上的,当天就冲第一;月之暗面K2.5早一周发的,后面天天涨;智谱GLM-5也紧跟放量。都不是单挑,是一起上,像赶集似的往OpenRouter货架上摆货。没等谁喊口号,市场自己就选了。 关键不是堆参数,是真省钱。MoE架构让推理便宜多了,算下来一个百万Token只要3毛钱,比Claude Opus便宜16倍。有人问便宜是不是烂?结果Kimi K2.5搞多智能体并行,GLM-5一周干出0.8T Token,说明又快又稳。技术没偷工减料,只是换了个更聪明的法子跑。 背后是算力真接上了。首都在线和智谱一起建智能算力集群,国产GPU也能跑得动;成都那个奥飞数据智算中心,就在成渝枢纽上,不光是挂个牌子,是实打实调度流量。东数西算不是PPT,是现在每秒都在跑的数据流。 美股那边反应挺真实——英伟达一天跌掉1.77万亿人民币。不是它做错了什么,是大家突然发现,光攥着高端GPU已经不够用了。模型跑得顺、成本压得低、本地能调度,这些事越来越重要。芯片还是贵,但值钱的地方,慢慢移到了别处。 A股跟着跳,云天励飞直接20CM涨停,思看科技涨10%。不是瞎炒,是真有人在下单买国产服务器、租IDC机柜、改模型适配国产卡。产业链上每一环,都开始重新算账。 Token现在不是冷冰冰的计数单位,越来越像水电煤,是AI时代的“数字燃料”。定价也不再是统一价,有按任务算的,有按结果分的,还有定制包月的。模型公司不再只卖API,开始帮客户搭流程、接系统、改prompt。 数据合规这事还没完全落地,出海时被卡一下是常事。MoE架构的专利墙也在冒头,有些核心细节国外不公开。但眼下最实在的指标,是国产GPU在推理场景里到底跑了多少真实请求,还有OpenRouter上中国模型的付费用户比例涨没涨。 调用量上去了,接下来比的是谁能更快把AI塞进工厂流水线、银行风控系统、医院影像科——不是比谁模型大,是比谁反应快、不卡顿、不掉链子。


