一直觉得这轮算力荒被误读了。表面看是供给不够,H100交付要18个月,HBM缺口60%。但火山引擎谭待讲了句特别扎心的话:超过50%的Token消耗在智能体的“无效探索”上。翻译一下就是,我们不是算力不够,是模型太蠢,蠢到要靠反复试错来完成任务,蠢到单token再便宜也扛不住它的浪费。所以这场涨价潮的本质,是全行业在为大模型的智商缺陷买单。英伟达赚的每一分钱里,都有一半是模型“想不明白”交的学费。 Token消耗激增引发算力涨价 token消耗激增引发算力涨价
一直觉得这轮算力荒被误读了。表面看是供给不够,H100交付要18个月,HBM缺口60%。但火山引擎谭待讲了句特别扎心的话:超过50%的Token消耗在智能体的“无效探索”上。翻译一下就是,我们不是算力不够,是模型太蠢,蠢到要靠反复试错来完成任务,蠢到单token再便宜也扛不住它的浪费。所以这场涨价潮的本质,是全行业在为大模型的智商缺陷买单。英伟达赚的每一分钱里,都有一半是模型“想不明白”交的学费。 Token消耗激增引发算力涨价 token消耗激增引发算力涨价