AI算力狂奔,内存却拖后腿,谁在悄悄改写游戏规则?
今天刷到黄仁勋和戴尔老板在Dell World现场一起说“内存是一大挑战”,语气挺淡,但听的人心里一紧。没提缺GPU,反倒盯着内存说事,这事儿不寻常。后来查了下数据,英伟达今年HBM采购量涨了3.2倍,可服务器出货反而慢了,卡在存储子系统上。不是芯片不够,是整个数据跑不动了。
KV Cache这东西,原本大家不太细想,现在大模型动不动要处理几万字上下文,它就跟着平方级地涨。HBM堆得再高,也扛不住发热和成本崩盘。SK海力士的HBM3e良率到现在还没过65%,光靠堆层数行不通。英伟达推的新平台BlueField-4配16TB上下文存储,听着像救星,其实是被逼出来的补丁。
光模块这块更明显。铜线跑到112Gbps就开始乱码,中际旭创这些中国厂子占了全球AI光模块七成三出货,不是靠低价,是真能把200G光互联塞进2U服务器里。浪潮和华为的液冷整机柜把PUE压到1.08,但光冷却没用,还得跟英伟达的DPU协议对上、跟Context Memory系统联调。现在中国人干的活,早不是拧螺丝,是改通信语言。
黄仁勋刚跟着特朗普来完华,嘴上说“代表美国”,转身就让团队跟阿里云测AI SSD,还跟中际旭创聊光互连产能。AMD的苏姿丰紧跟着来,说EPYC跑在中国700多个云实例上,其实是在推x86+国产AI芯片混搭。这不是妥协,是发现单靠GPU撑不住Agent时代——金融风控Agent要5毫秒响应、记72小时数据,进口方案根本没法落地。
黄仁勋指甲被喷灰指甲那天,他正蹲南锣鼓巷吃豆汁。热搜底下吵半天,没人提他那天下午开了三场会,两场跟存储厂商,一场跟光模块工程师。技术巨头也是人,也会赶场、也会饿、也会被拍到手指发黄。但饭吃完,会议继续,该谈的协议一个没少签。
这事不是缺货这么简单。是原来那套打法不管用了。
黄仁勋担心的,从来不是内存够不够。





