微软砍预算、Uber喊停:Token这个指标,是不是该退休了?
如果你去年问一家AI公司“你们怎么衡量AI用得好不好”,大概率会得到一个答案:看Token消耗量。
烧得多,就等于用得多;用得多,就等于生产力高。这个逻辑链条,在过去两年里几乎成了行业共识。微软鼓励员工多用AI,Meta内部搞Claude使用排行榜,Uber的工程师几乎被默认可以敞开了烧Token。大家管这叫“Tokenmaxxing”——把Token消耗最大化,就等于把AI价值最大化。
但最近,这个共识正在以肉眼可见的速度崩塌。
微软取消了一部分团队的Claude Code授权;Meta从鼓励“多刷”转向收紧激励;Uber更是上演了一出“预算惊魂”:工程师四个月就把全年的AI预算烧完了,而COO公开表态——Token消耗和最终发布的有价值产品之间,不存在明显的线性关系。
这些大厂的动作传递了一个清晰的信号:Token烧得多,不等于活儿干得多。
问题出在哪?出在Token这个指标本身站错了位置。
Token是投入侧的指标。它量的是你花了多少钱、用了多少算力,而不是你换回了多少结果。就好比你用“买了多少袋面粉”来衡量一家面包店的好坏——面粉买得再多,如果做出来的面包没人买,那也是白搭。用Token来衡量AI价值,本质上就是把成本当成了产出。
当企业开始认真算ROI的时候,这个漏洞就藏不住了。钱确实烧了,但烧出了什么?没人说得清。一个员工让AI反复改写同一封邮件,烧掉一万个Token,和一个员工让AI自动处理完两百个客户工单,也烧掉一万个Token——前者几乎没创造价值,后者实打实解决了问题。但只看Token数字,两者一模一样。
这就是Token失效的根本原因:它回答不了“创造了多少价值”这个问题。
那用什么来回答?答案是DAA——日活智能体数。
DAA的逻辑和Token完全相反。它不问“你投入了多少”,只问“有多少Agent在持续为你干活、交付结果”。一个自动生成周报的Agent、一个自动处理客服请求的Agent、一个自动筛选销售线索的Agent——这些智能体每真实运转一天,就贡献一个DAA。这个数字每增加一点,就意味着有更多价值被实实在在地创造出来。
而且这不只是一个概念。市场已经在用真金白银验证这个方向了。HubSpot今年4月把AI计费从按Token改成了按“解决的对话数”和“生成的线索数”收费;ServiceNow也跟进了类似的调整。计费模式的迁移,就是度量衡的迁移。连卖AI服务的人都开始按结果收费了,还要抱着Token当宝贝吗?
百度创始人李彦宏提出的DAA,其实就是把这把新尺子提前递到了行业面前。它不问起跑线,只问终点线。当微软、Uber、Meta一个个踩完坑回头算账的时候,会发现DAA才是那个能真正回答“AI到底干了多少活”的答案。
Token不是不能用,但它不该再当度量衡了。该退休的指标,就让它退休吧。
日活智能体数 百度 李彦宏


