DC娱乐网

重磅!中国最大AI4S集群入网

国产算力迎来历史性一刻。在第九届数字中国建设峰会上,中科曙光超智融合算力集群正式接入全国一体化算力网。作为国内最大规模科

国产算力迎来历史性一刻。

在第九届数字中国建设峰会上,中科曙光超智融合算力集群正式接入全国一体化算力网。作为国内最大规模科学智能(AI4S)计算集群,该集群采用全栈自研技术,规模目前已突破6万卡。此次被纳入国家级算力调度主平台,代表着国产超智融合算力的一次系统性验收。

将其置于国产算力四十余年演进脉络中,这一事件具有值得审视的节点意义:它不仅是算力设施的一次互联互通,更标志着国产超智融合算力完成关键突围,全面迈向万卡级普惠时代。

01.“玻璃房”翻篇,国内最大AI4S集群完成纳管

上世纪80年代,中国石油勘探急需大型计算机。彼时进口设备不仅价格畸高,还附带一项特殊条件:机器须安装于透明机房,钥匙由外方保管,计算结果需交由对方审核。

工程师只能隔着玻璃操作自己的设备,每一行代码都处于监控之下。两院院士宋健痛心地指出:“‘玻璃房’是中国的耻辱。”这段记忆,成为国内高端计算自主崛起的关键注脚。

但近年来,大量超算中心长期亏损,立项与需求匹配错位,资源闲置、区域调度难等问题突出。全国政协委员、中科院计算所研究员张云泉也曾公开表示:“国产大规模智算集群计算效率普遍偏低,可扩展性不强,且多数仅支持低精度训练,通用性不足。”

在此背景下,中科曙光超智融合算力集群被全国一体化算力网纳管,具有了更深层的象征意义与实战价值——它是对国产大规模算力集群可靠性、兼容性及跨域响应能力的一次实质验收。

据悉,集群内部署了国内首款类InfiniBand 400G无损高速网络(scaleFabric系列产品),端侧通信延迟低于1微秒,并发作业调度效率超每秒万次,算力利用率稳定在80%左右。依托智能化运维、数字孪生及浸没相变液冷技术,系统可用性达99.99%,保障长周期稳定运行。

张云泉在ChinaSC 2025大会上的判断正在被逐步印证:“我们终将越过寒冬、迎来春天,中国超算也会再次勃发。”

02.超智融合架构,从“堆卡”到系统级工程能力

2026年,英伟达H200初获有条件对华出口许可,但新一代Blackwell架构B100/B200仍被禁运。与此同时,中国海关释放信号:性能次一级的芯片亦未必获准进入。这意味着,依赖进口芯片的路径已显著收窄,国产算力必须依靠系统工程的综合能力来弥补单点性能的代差。

但系统能力的提升并非靠简单堆砌算力卡,单纯堆卡的建设模式在国内已有教训。在AI大模型训练场景中,传统InfiniBand网络在万卡级互联下极易出现通信瓶颈,大规模集群算力利用率偏低,已是行业公开的难题。

中科曙光超智融合算力集群集成了6款自研核心芯片,并构建了存、算、传三位一体的紧耦合架构。“超级隧道”技术与AI数据加速设计用于打通底层数据通道,scaleFabric网络实现零丢包、低时延传输,使万卡级集群从“建得起来”真正走向“用得起来”。

更具价值的是曙光的“超智融合”架构。传统超算擅长双精度浮点计算,AI训练则大量使用低精度(如FP16、INT8),导致许多算力中心建成后只能服务于AI模型训练,无法承接高精度科学计算任务。

科学智能(AI4S)要求混合精度并行——既需要大规模算力,又要求计算精度。该集群依托自主可控核心芯片,支持8/16/32/64位宽的全精度计算,使超算与智算能力共存于同一集群中,有力回应了“建了算力中心却做不了高精度科学计算”的结构性错配问题。

03.面向中小企业开放,从“少数专享”到“算力普惠”

“让算力像水电一样普惠”是“十五五”规划对全国一体化算力网的愿景表述。中科曙光集群接入算力网后,将通过统管统纳机制,面向中小企业和科研机构提供低成本、高效率的算力服务。

过去,万卡级顶级算力往往被少数大型科技企业垄断,广大中小企业与科研机构长期面临“算力贵、算力难”的困境。

此次集群纳入全国一体化算力网,意味着顶级算力将作为公共资源向全国开放,真正打破算力垄断。——这对于缓解中小机构的算力痛点,具有现实而深远的意义。

长远来看,6万卡超智融合算力集群被国家级平台纳管,为国产算力从“建得起”走向“用得好”提供了一个实证样本。接下来,市场的检验与用户的反馈,将是最有说服力的答案。

声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。