算力王炸!国家3万卡集群超算互联网核心节点上线试运行 最新名单国产算力王炸!国家3万卡集群超算互联网核心节点上线试运行,最新名单~
据财联社、《科创板日报》2月5日讯,国家超算互联网应用技术大会暨核心节点上线试运行仪式在郑州举行。此次上线试运行的算力资源由曙光scaleX万卡超集群系统提供支撑,可对外提供超3万卡的国产AI算力,是国家超算互联网平台上线以来接入的全国最大单体国产AI算力资源池,可为万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景提供高效算力服务。
值得一提的是,此次由曙光scaleX万卡超集群支撑的核心节点,以超3万卡的国产AI算力规模,成为国家超算互联网平台接入的最大单体国产AI算力资源池,不仅填补了大规模国产算力部署的空白,更在英伟达H200芯片对华出口未获批准的背景下,彰显了国产算力自主可控的硬实力。
就在核心节点上线前一日,美国政府仍未放开英伟达H200芯片的对华出口限制,而这款被视为高端AI训练“标配”的芯片,长期占据全球AI算力市场的核心地位。
反观我国此次上线的超算节点,从芯片到集群架构实现100%国产化,3万卡的规模相当于三座标准万卡集群的算力聚合,可直接支撑万亿参数模型训练、高通量推理及AI for Science等尖端场景。
据技术实测,该集群总算力超15EFlops(FP16),训练千亿参数大模型的效率较传统集群提升8-10倍,将原本需要数月的训练周期压缩至数周,彻底打破了海外算力垄断对我国AI产业发展的束缚。
值得注意的是,支撑这一算力奇迹的曙光scaleX超集群,暗藏着国产算力的多重技术突破。其核心组成单元scaleX640超节点采用全球首创的单机柜640卡架构,通过浸没相变液冷技术将PUE值控制在1.04的极致水平,较传统风冷集群能耗降低40%以上。
更关键的是,该集群搭载了寒武纪思元590、海光DCU及曙光自研BW100等多款国产AI芯片,单卡FP8算力达1.88PFLOPS,较同类国产芯片提升20%,能效比已达到国际主流水平的85%。配合曙光自主研发的scaleFabric原生RDMA高速网络,卡间通信延迟低至0.8微秒,带宽达400Gb/s,使3万卡集群的线性加速比保持在0.92的国际领先水平,解决了大规模集群协同效率的行业痛点。
需要强调的是,此次核心节点的落地,标志着国产AI芯片已走向大规模化部署的关键阶段。
曙光scaleX集群通过“三级全互联架构”与“存算传紧耦合优化”设计,实现了400+主流大模型的适配优化,资源利用率较传统集群提升55%,证明国产算力已具备支撑产业级应用的成熟度。
后续,随着AI+行动的深入推进,我国智算中心建设进入加速期,据IDC数据,2025年中国AI计算加速芯片市场规模达2398亿元,年复合增长率超68%,大规模国产算力集群的落地将直接拉动芯片设计、服务器制造、高速网络、液冷等全产业链的需求爆发。
对于国产算力产业链而言,上游芯片设计领域,海光信息、寒武纪等企业凭借成熟的产品迭代能力,将持续受益于算力中心的规模化采购;中游设备制造环节,中科曙光作为系统集成龙头,其scaleX超集群方案已形成技术壁垒,工业富联等企业则在服务器代工领域占据优势;瓶颈环节的中际旭创(光模块)、长电科技(先进封装)等企业,将充分享受供需错配带来的溢价。
更重要的是,国产算力生态正加速成型,以“光合组织”为代表的开放协同模式,正通过标准统一与技术共享,弥补国产算力在单一产品上的差距,形成系统级竞争优势。
从国家战略层面看,超算互联网核心节点的上线是“主权AI”建设的关键一步。在全球科技竞争加剧的背景下,算力已成为国家战略资源,自主可控的算力基础设施是保障AI产业安全发展的核心屏障。
随着后续更多大型国产算力中心的投入运行,我国将逐步摆脱对海外高端芯片的依赖,形成从芯片设计、集群建设到应用落地的完整产业链闭环。这不仅将降低AI产业的发展成本,更将为AI for Science、智能驾驶、数字经济等领域的创新提供充足动力。
需要指出的是,随着此次国产3万卡集群算力中心的上线、以及AI+行动计划政策支持与市场需求的双重驱动下,国产AI算力产业链有望迎来黄金发展期,