DC娱乐网

发布会上,一个数字砸下来,整个会场空气都凝固了几秒:AI推理成本,以后每年,直接

发布会上,一个数字砸下来,整个会场空气都凝固了几秒:AI推理成本,以后每年,直接砍掉九成。 什么概念? 这就等于说,过去那种只有少数几个巨头烧得起钱、关起门来“炼丹”搞大模型的时代,可能要翻篇了。未来几年,算力消耗的大头,不再是训练一个神,而是供养无数个小鬼——满大街跑的都是各种各样的AI应用,成本低到可以忽略不计。 规则彻底变了。以前大家比谁的训练集群更大、网速更快。以后,战场转移了,比的是谁能让一个AI应用跑起来成本更低、反应更快、能同时伺候更多人。 曙光甩出来的那个叫scaleX40的“超节点”,就是冲着这个来的。他们想干的事很直接:把一堆GPU的内存直接焊在一起,当成一整块用,再搞个聪明的总管家,能把不同厂家的芯片都叫过来干活。 听着很美。 但一个最扎心的问题摆在桌上:光靠把一堆铁疙瘩更紧密地塞进一个机柜里,就能凭空变出这么大的利润空间? 真正的降本,从来不是只靠硬件堆料。那是一场从上到下的手术,硬件、调度、网络、存储,每一层都得动刀,把所有的油水都挤干净才行。 所以,这到底是AI进入“毛细血管”的号角,还是又一个讲给资本听的热血故事?