拉斯维加斯,CES 2026主论坛。
黄仁勋依然穿着那件标志性的黑色皮衣,走上台时并没有带来任何硬件新品,却抛出了一个更重磅的观点:“计算行业的每一层,都正在被重写。”
九十分钟的演讲里,这位英伟达创始人勾勒的是一幅AI全面工业化落地的全景图——从代码世界到物理世界的迁移,正在以超出预期的速度发生。
这不是渐进式改良,而是一场范式级别的颠覆。当软件从“被编程”转向“被训练”,当AI从生成文本走向理解物理定律,一个价值十万亿美元的计算基础设施体系,正在经历前所未有的现代化改造。

重新定义AI,从重构计算行业开始
每隔十到十五年,计算行业就会迎来一次范式级的地震。但这次有所不同——我们正在同时经历两场平台迁移的叠加效应。
黄仁勋清晰地描绘了这一变革的层次:应用正在转向以AI为地基进行构建,而软件开发本身也从“编写”转向“训练”。这意味着,过去的计算堆栈正在被重新定义。
“你不再‘编程’软件,而是‘训练’软件;你不再在CPU上运行它,而是在GPU上运行它。”在黄仁勋看来,这种转变不是渐进式的优化,而是计算根本逻辑的颠覆。软件不再是被预先录制的静态代码,而是能够理解上下文、实时生成的动态系统。
这种颠覆的规模令人咋舌。黄仁勋透露,价值约十万亿美元的现有计算基础设施,正在经历一场彻底的现代化改造,以适应这种新的计算范式。
全球研发预算的显著比例正在转向AI领域,一场涉及整个产业链的价值重配已然启动。
智能体革命:机器开始“思考”
如果说2023年的ChatGPT,让世界看到了AI的潜力,那么2025年智能体系统的普及,则标志着AI开始真正解决实际问题。
黄仁勋将智能体系统的崛起视为关键转折。这些具备推理能力的AI不再只是被动响应指令,而是能够主动研究、规划、使用工具,甚至进行复杂的任务分解。
一个典型的例子来自英伟达内部。黄仁勋透露,名为Cursor的智能体已经彻底改变了公司的软件开发方式。这种变化不是简单的效率提升,而是工作范式的根本转变——开发者从编写代码转向训练和引导AI。
智能体的突破在于“测试时缩放”能力。AI在回答问题时可以进行实时思考,通过多步推理找到解决方案,这种能力让AI能够处理从未训练过的新情况。
同时,黄仁勋提出了“多模型”协作框架。在这个框架下,AI可以自主调用最适合的模型来解决子问题,形成动态的模型协作网络。
这意味着未来的AI应用将是多模态、跨模型、混合云部署的复杂系统,既保持个性化定制能力,又始终处于技术前沿。
物理AI:当数字智能学会与世界交互
“物理AI的ChatGPT时刻即将到来。”黄仁勋的这一判断,指向了AI进化的下一片蓝海。
过去八年,英伟达一直在攻克一个根本难题:如何让数字智能理解并交互物理世界?对于人类孩童来说,物体恒存性、重力、摩擦力这些概念是本能认知,但对AI却完全是未知领域。
英伟达的解决方案是构建三机协同系统:一台训练AI模型,一台在机器人或汽车上进行实时推理,第三台则用于高精度物理模拟,生成训练数据并评估AI行为。
在这个体系中,模拟技术成为关键突破口。通过创建基于物理定律的合成数据,AI可以在虚拟环境中无限次试错学习,而无需依赖昂贵且有限的实际数据收集。
Cosmos世界基础模型在这一过程中扮演核心角色。这个开源模型能够理解物理世界运行规律,生成符合物理定律的合成场景。基于此,英伟达训练并开源了其首个端到端自动驾驶系统——Alpamayo。
Alpamayo的独特之处在于它的可解释性。它不仅能够驾驶汽车,还能向乘客解释其决策背后的推理过程。
这种能力对于处理自动驾驶中的“长尾问题”至关重要——通过将罕见场景分解为已知的常见情况,AI能够推理出安全的解决方案。
开源战略:以开放生态驱动AI工业化
在AI竞赛日趋白热化的当下,英伟达选择全面开源。
黄仁勋坦言:“开源模型已经达到了前沿水平。”虽然与最顶尖的专有模型仍有约半年的差距,但开源模型的快速迭代正在激活全球范围内的创新能量。
这一战略背后的逻辑深刻而务实。
黄仁勋反问道:“智能,数字形式的智能——怎么可能抛下任何人?”
当每个行业、每家企业、每个国家都能基于开源工具构建自己的AI系统时,整个生态的活力将被完全释放。
数据印证了这一判断:开源模型的下载量呈现爆炸式增长。从初创公司到大型企业,从研究机构到各国政府,都在基于开源模型推进自己的AI项目。
英伟达的开源不仅是模型本身,更是完整的工具链和训练数据。NeMo库系列提供了从数据处理、模型训练到部署评估的全套开源工具。
这种深度开放,实际上是在为AI工业化时代制定事实标准——当全球开发者都使用同一套工具链,生态的聚集效应将形成难以逾越的护城河。
全栈野心:垂直整合构筑新护城河
从芯片到机器人,英伟达正在展示全栈整合的战略雄心。黄仁勋在演讲中详细描绘了这种垂直能力如何解决复杂系统问题。
以自动驾驶为例,英伟达构建了从底层芯片到上层应用的完整技术栈。Alpamayo系统体现了这种整合的优势:端到端训练让驾驶决策更加自然流畅,而双重冗余设计则确保了安全性——当AI系统对特定场景不够自信时,车辆会无缝切换到更保守的经典自动驾驶系统。
这种冗余设计理念不仅应用于自动驾驶,也贯穿于英伟达的各类物理AI系统。在安全性至关重要的领域,单一系统无论多么先进都不够,多重保障机制是必要选择。
通过与Cadence、Synopsys、西门子等工业巨头的深度合作,英伟达的技术正被嵌入全球工业设计和制造的核心环节。当芯片设计工具、工业仿真平台都内置了英伟达的AI加速能力,技术生态的粘性将变得更加牢固。
Rubin平台:为AI工业化铺就高速公路
面对AI模型规模每年10倍增长、推理需求激增的挑战,黄仁勋宣布了一个重磅消息:Rubin平台已进入全面生产阶段。
在摩尔定律放缓的背景下,传统芯片迭代路径已无法满足AI计算的指数级需求。Rubin平台的突破在于“极端协同设计”——对CPU、GPU、网络芯片等所有组件进行协同重新设计,实现系统级优化。
结果是惊人的:在晶体管数量仅增加1.6倍的情况下,Rubin GPU的AI浮点性能达到前代的5倍。这一突破源于全新的NVFP4 Tensor Core设计,它能够动态调整精度和结构,在保持准确性的同时大幅提升吞吐量。
Rubin平台的系统级创新同样引人注目:完全液冷设计使数据中心能够使用45摄氏度的冷却水,无需传统冷水机组;全系统机密计算确保数据在传输、存储和计算过程中的全程安全;功率平滑技术则避免了对电源系统的过度配置需求。
成本结构的重塑可能是Rubin平台最具影响力的突破。黄仁勋透露,该平台将推理成本降低到原来的约十分之一。
每个token生成成本的大幅下降,将直接推动AI服务价格的降低和可访问性的提高,为AI的大规模应用扫清经济性障碍。
机器人时代:物理AI的终极疆域
自动驾驶汽车只是物理AI应用的起点。黄仁勋指出,相同的技术栈正在催生更广泛的机器人革命。
从简单的机械臂到复杂的人形机器人,从仓库物流到医疗护理,物理AI的应用场景正在快速扩展。这种扩张的基础是“三计算机”架构的通用性——训练、推理、模拟的协同工作模式,可以适配各种形态的机器人系统。
黄仁勋现场展示了英伟达与多家机器人公司的合作成果。波士顿动力的人形机器人、卡特彼勒的巨型采矿机械、各类服务型机器人……这些形态各异的机器共享着同一个特征:它们的大脑都由英伟达的技术驱动。
未来的机器人系统将是“通专融合”的典范。它们既具备广泛的世界知识和常识推理能力,又能通过特定训练精通专业任务。这种设计使机器人能够适应多样化环境和任务需求,不再局限于单一功能。
物理AI的发展最终指向一个宏大的愿景:数字世界与物理世界的深度融合。
当AI不仅理解语言和图像,也能理解物理定律和现实约束,真正的通用人工智能才可能从概念走向现实。