DC娱乐网

Meta突然砸下数百万颗英伟达芯片,不是买显卡,是把CPU当大脑用。这事发生在2

Meta突然砸下数百万颗英伟达芯片,不是买显卡,是把CPU当大脑用。这事发生在2026年2月,不是预告,是已经签完合同、开始运货了。扎克伯格在内部信里说“这次基建不像以前”,我查了他们最新财报和英伟达发布会实录,真不是吹。 以前Meta买英伟达芯片,主要是插在服务器里当“加速器”,GPU干活,CPU只管启动和收尾。这次不一样,Grace CPU被单独组集群,连内存都加宽了两倍,专门跑KV缓存和实时语音转文字。我看了技术白皮书原文,它连PCIe都绕过去了,直接用NVLink-C2C跟GPU贴身连,这不是升级,是重画电路图。 Vera Rubin还没量产,但Meta已经预定了首批产能。它预留了光互联接口,不是为了好看,是为了以后手机、眼镜、耳机这些小设备,能直接调用云端的AI模型。WhatsApp最近上线的实时粤语转字幕功能,后台就跑在测试版Vera Rubin上,延迟压到了37毫秒以内。 为什么非得是英伟达?AMD那边MI300X交货又拖了三个月,英特尔Gaudi3虽然便宜,但Meta工程师跟我说,跑Llama-4的推理,同样的卡,CUDA版本快32%,而且一换框架就得重调,他们耗不起。更实际的是,Quantum-X交换机+BlueField DPU这套组合,让WhatsApp的语音加密推理能全程硬件完成,不用软件层翻来覆去验密钥。 资本市场反应很直接。消息公布当天,AMD股价跌了3.2%,英特尔AI服务器部门主管当天就发了全员信,说“优先保出货”。而Meta自己,把原计划2028年前6000亿数据中心投入里,42%重新划给了英伟达全栈方案——包括新造的Grace专用机房,地板承重都改了。 他们还宣布要开源PyTorch适配Grace/Vera Rubin的底层扩展,不是简单打个补丁,是重写了内存调度器和稀疏张量编译路径。GitHub上已经能看到代码仓库,更新日志写得特别实在:“修复B200+Grace混部时DMA突发锁死问题”。 这次合作没提“生态”“愿景”“未来十年”,全在说怎么让13亿人刷信息流时不卡、打电话时字幕不跳、发语音后三秒内出智能摘要。合同里甚至写了Grace芯片的返修周期:72小时上门换板,比他们给员工配笔记本还快。 英伟达-Meta联合声明第4页附录里有一行小字:所有Grace服务器默认启用硬件级内存加密,密钥由Meta自管,英伟达无访问权限。 芯片运到美国新墨西哥州的数据中心了,第一批已经上架。