当地时间 2025 年 10 月 27 日,美国能源部(U.S. Department of Energy, DOE)正式宣布,将与芯片巨头超威半导体(Advanced Micro Devices , AMD) 合作,共同投入超过 10 亿美元的公共及私人资金,在橡树岭国家实验室(Oak Ridge National Laboratory, ORNL)部署两台下一代 AI 超级计算机:Lux 和 Discovery。
图 | 美国橡树岭国家实验室 (来源: Youtube)
此次合作的主要目的,旨在突破现有的 Frontier (前沿计划) 百亿亿次级系统的性能限制,推动高性能计算(High-Performance Computing, 简称 HPC)与 AI 进一步融合。根据不同战略,DOE 对新型计算能力的需求被具体化为两个不同的系统,Lux 和 Discovery 也承担着不同的角色。
首先是 Lux AI 超级计算机集群,计划于 2026 年初投入使用。Lux 被定位为美国首个专用于科学、能源和国家安全的 AI 工厂(AI Factory)。它的任务是快速、大规模地训练和调优 AI 基础模型,以应对迫在眉睫的科研需求。该系统将采用 AMD Instinct MI355X GPU、AMD EPYC CPU 以及 AMD Pensando 高级网络技术,并由慧与公司(Hewlett Packard Enterprise, 简称 HPE)建造,同时甲骨文云基础设施(Oracle Cloud Infrastructure, 简称 OCI)也参与了共同开发。
图 | AMD 的 instinct 芯片(来源:Youtube)
与 Lux 的即时性不同,Discovery 超级计算机则代表了更长期的、对未来计算架构的规划。Discovery 预计于 2028 年交付,并在 2029 年投入用户运营,将成为 DOE 在 ORNL 的下一代旗舰级超级计算机。该系统将基于 HPE 的 Cray Supercomputing GX5000 平台,核心硬件将集成 AMD 下一代代号为“Venice”的 EPYC 处理器和 AMD Instinct MI430X GPU。值得注意的是,MI430X 加速器被 AMD 特别强调是针对主权 AI 和科学计算工程而设计。
在技术规格上,Discovery 的核心设计理念是提供超越现有 Frontier 系统的性能和效率,其“带宽无处不在”(Bandwidth Everywhere)的设计将大幅提升内存和网络带宽,从而优化科学和 AI 应用的运行效率。这一升级不仅关乎原始计算速度,更在于推动 HPC 与 AI 更深层次的集成。ORNL 方面指出,Discovery 的计算引擎能够以空前速度生成和分析数据,加速 AI 模型的训练,使得科研人员可以将为 Frontier 编写的应用无缝迁移至新系统。
此次合作的重点是这两套超级计算机所承载的应用前景,Lux 和 Discovery 在能源、安全和医疗等领域进行 AI 驱动的能力被寄予厚望。
首先是能源领域,通过 AI 加速先进反应堆和电池等技术的部署,它们将被用于推进如核电、核聚变、电网现代化等优先事项。使其更具成本效益和安全性。例如,通过高性能计算对复杂流体动力学进行建模,可以提高核电站的运营效率和长期可靠性。
其次,在国家安全层面,尽管具体任务细节对外并不公布。但新系统的高安全架构和对主权 AI 的强调,意味着它们或许将服务于高度敏感的防御和情报任务。
在生物科学和医学方面,新系统的应用前景尤其引人注目。橡树岭实验室的研究人员表示:Discovery 的强大算力将推动 AI 驱动数字孪生(AI-driven digital twins)技术的实现,即研究人员可以创建高度逼真的计算模型,模拟人类器官、病理进程甚至个体患者的生理反应。通过在这些虚拟副本上快速测试药物剂量或治疗策略,计算科学有望显著缩短药物和疗法从实验室到临床的转化时间,为包括癌症在内的复杂疾病提供更具针对性的解决方案。
图 | Discovery 将实现的人体数字建模(来源:Youtube)
但是这种基于纯粹算力提升的医疗突破期望也受到了专业人士的质疑。美国卫生与公众服务部健康先进研究项目局(ARPA-H)的精准肿瘤学项目负责人特雷·伊德克尔(Trey Ideker)博士在业内评论中指出,尽管 AI 绝对能在未来几年对癌症治疗产生巨大影响,但“AI 无法独自解决癌症”。伊德克尔博士认为,该领域面临的最大挑战在于数据限制,而非计算能力。他强调,癌症研究缺乏像 LLMs 那样拥有整个互联网规模的数据集,其数据多模态且分散(包括基因序列、组织扫描、影像等),只有医院在能力和意愿范围内共享。
此外,在先进材料和制造业领域,Lux 和 Discovery 或将应用于发现新的电池材料、高性能催化剂和关键元件,以此助力美国的工业创新发展。
参考链接:
1.https://ir.amd.com/news-events/press-releases/detail/1264/amd-powers-u-s-sovereign-ai-factory-supercomputers-accelerating-an-open-american-ai-stack
2.https://www.ornl.gov/news/ornl-amd-and-hpe-deliver-does-newest-ai-supercomputers-discovery-and-lux
3.https://www.reuters.com/business/energy/us-department-energy-forms-1-billion-supercomputer-ai-partnership-with-amd-2025-10-27/
运营/排版:何晨龙