2026 年 5 月上旬,马斯克接连公布两项关于 AI 业务的重磅决定,先是宣布 xAI 解散并入 SpaceX 并更名 SpaceXAI,随后把 Colossus1 集群的全部算力租给 Anthropic。
行业普遍把这一系列动作解读为马斯克在 AI 领域竞争失利后的收缩行为,但事实并非简单的失败退场,而是一场经过精密计算的战略调整。
外界关注的核心焦点,集中在 Colossus1 算力的转移上。这个集群配备 22 万张 GPU,电力消耗达 300 兆瓦,坐落于孟菲斯郊外,其核心硬件是 20 万张 H100 显卡,属于英伟达上一代 Hopper 架构产品。
目前 AI 行业训练主流已经切换到 Blackwell 架构,GB200 单卡算力是 H100 的 2.5 倍,训练效率提升一个量级,头部企业训练前沿模型均采用新架构芯片,Colossus1 的硬件性能已经跟不上行业前沿竞争节奏,属于存量旧算力资产。
马斯克在转出旧算力的同时,全力推进新算力集群 Colossus2 的建设。该集群从规划阶段就确定采用 Blackwell 架构,初期部署 11 万张 GB200 显卡。
最终规划规模达 35 万张,机房位置距离 Colossus1 仅 15 公里,目前处于施工和通电调试阶段。这种处置方式清晰体现马斯克的算力布局思路,放弃过时资产,集中资源投入新一代算力建设。
xAI 并入 SpaceX 的背后,是这家独立 AI 公司长期积累的多重经营难题集中爆发。资金消耗方面,2025 年 xAI 每月资金损耗达 10 亿美元,全年亏损预计 130 亿美元,高额投入没有换来对应的市场份额提升。
市场拓展方面,Grok 系列模型虽在测试中实现小幅性能追赶,但始终无法有效打开企业和开发者市场,AI 行业竞争重点已转向生态和工具链,xAI 在这些方面持续处于落后状态。
团队层面的问题同样突出,从 2025 年 2 月开始,xAI 核心成员陆续离职,到 2026 年 3 月底创始团队已全部离开,技术公司核心人才的流失让 xAI 丧失独立发展的核心动力。
硬件利用效率的问题最为关键,行业数据显示 xAI 囤积 55 万张 GPU,实际利用率仅 11%,远低于 Meta 的 43% 和 Google 的 46%。
换算后其等效产能仅相当于 6 万张卡满负荷运行,高成本投入与实际产出严重不匹配,多重压力下并入 SpaceX 成为 xAI 的现实选择。
Grok 系列模型并未随着 xAI 解散而终止发展,马斯克在合并消息公布后明确表示,将在 Colossus2 集群上训练多款新版 Grok 模型,Grok 的身份从独立公司旗舰产品转变为 SpaceXAI 旗下内部业务线。
这种身份转变让 Grok 可以共享 SpaceX 的资金、基础设施和运营资源,不用再独立承担融资和亏损压力,但发展节奏和资源投入也将完全服从 SpaceXAI 的整体规划。
Grok 后续发展的核心挑战,不在于组织架构调整或新算力规模,而在于算力利用率的提升。Colossus2 的 GB200 显卡具备行业顶尖硬件性能,但硬件上限需要匹配高效的软件调度和任务优化能力,才能转化为实际产出。
xAI 此前低利用率的问题,涉及调度系统重构、训练任务并行优化等复杂工程问题,而创始团队全员离职后,解决这些技术难题的人才储备存在明显缺口,这成为决定 Grok 未来竞争力的关键变量。
孟菲斯郊外的 Colossus1 机房依旧保持运行,22 万张 GPU 持续为 Anthropic 的模型训练提供算力支持,15 公里外的 Colossus2 机房正在加速建设,新旧算力的交替完成。
Grok 的发展路径已经改变,从独立竞争转向依托 SpaceX 生态的内部业务,真正的考验才刚刚开始,后续发展将取决于技术难题的攻克和资源整合的实际效果。

