DC娱乐网

FP64+FP8通吃!你懂不懂中科曙光scaleX万卡超集群的含金量? 作为搞

FP64+FP8通吃!你懂不懂中科曙光scaleX万卡超集群的含金量?

作为搞技术的,逛展咱不看热闹看门道。今天在智博会盯着曙光的scaleX万卡集群琢磨了半天,有几个硬核技术点确实值得细品。

首先是“全精度”支持,直接从FP8覆盖到FP64。这在目前的AI服务器里相当少见,毕竟很多AI卡为了追求极致吞吐量,往往会阉割掉双精度性能。曙光这么干,显然是精准瞄准了AI for Science(AI4S)赛道——像流体力学、量子化学这些领域,没FP64根本跑不动。

其次是互联架构与密度的降维打击。现场最直观的冲击来自物理形态:隔壁华为384超节点走的是多机柜阵列展开的“分布式”打法,而曙光的scaleX万卡集群则死磕极致的“单柜高密”。它在一个标准机柜内就塞进了640张加速卡,直接把算力密度拉升了约20倍。配合自研的scaleFabric网络和存算传紧耦合优化,GPU利用率能提升55%,大幅压缩了大规模并行计算的通信开销。

再加上浸没相变液冷把PUE压到了1.04,这不仅是为了环保,更是为了让高密度计算能7×24小时稳定运行。从技术指标看,这套系统确实是专为解决万亿参数模型和复杂科学计算而生的“重器”。