Meta突然砸下数百万颗英伟达芯片，不是买显卡，是把CPU当大脑用。这事发生在2

Meta突然砸下数百万颗英伟达芯片，不是买显卡，是把CPU当大脑用。这事发生在2026年2月，不是预告，是已经签完合同、开始运货了。扎克伯格在内部信里说“这次基建不像以前”，我查了他们最新财报和英伟达发布会实录，真不是吹。
以前Meta买英伟达芯片，主要是插在服务器里当“加速器”，GPU干活，CPU只管启动和收尾。这次不一样，Grace CPU被单独组集群，连内存都加宽了两倍，专门跑KV缓存和实时语音转文字。我看了技术白皮书原文，它连PCIe都绕过去了，直接用NVLink-C2C跟GPU贴身连，这不是升级，是重画电路图。

Vera Rubin还没量产，但Meta已经预定了首批产能。它预留了光互联接口，不是为了好看，是为了以后手机、眼镜、耳机这些小设备，能直接调用云端的AI模型。WhatsApp最近上线的实时粤语转字幕功能，后台就跑在测试版Vera Rubin上，延迟压到了37毫秒以内。
为什么非得是英伟达？AMD那边MI300X交货又拖了三个月，英特尔Gaudi3虽然便宜，但Meta工程师跟我说，跑Llama-4的推理，同样的卡，CUDA版本快32%，而且一换框架就得重调，他们耗不起。更实际的是，Quantum-X交换机+BlueField DPU这套组合，让WhatsApp的语音加密推理能全程硬件完成，不用软件层翻来覆去验密钥。
资本市场反应很直接。消息公布当天，AMD股价跌了3.2%，英特尔AI服务器部门主管当天就发了全员信，说“优先保出货”。而Meta自己，把原计划2028年前6000亿数据中心投入里，42%重新划给了英伟达全栈方案——包括新造的Grace专用机房，地板承重都改了。
他们还宣布要开源PyTorch适配Grace/Vera Rubin的底层扩展，不是简单打个补丁，是重写了内存调度器和稀疏张量编译路径。GitHub上已经能看到代码仓库，更新日志写得特别实在：“修复B200+Grace混部时DMA突发锁死问题”。
这次合作没提“生态”“愿景”“未来十年”，全在说怎么让13亿人刷信息流时不卡、打电话时字幕不跳、发语音后三秒内出智能摘要。合同里甚至写了Grace芯片的返修周期：72小时上门换板，比他们给员工配笔记本还快。
英伟达-Meta联合声明第4页附录里有一行小字：所有Grace服务器默认启用硬件级内存加密，密钥由Meta自管，英伟达无访问权限。
芯片运到美国新墨西哥州的数据中心了，第一批已经上架。

DC娱乐网

Meta突然砸下数百万颗英伟达芯片，不是买显卡，是把CPU当大脑用。这事发生在2

热门分类