DC娱乐网

国产高速网络新突破!中科曙光scaleFabric来袭

当人工智能大模型迈入万亿参数时代,万卡乃至十万卡级智算集群成为训练核心载体,网络通信效率却成了制约算力利用率的关键——传统以太网难以满足低时延、高带宽、全程无损的要求,海外InfiniBand网络的技术与市场垄断,更让国内算力基建面临"卡脖子"风险。

3月12日,中科曙光在郑州推出全栈自研400G无损高速网络scaleFabric,作为国内首款原生RDMA高速网络系统,它从底层112G SerDes IP、交换芯片、网卡硬件,到上层驱动、管理软件实现100%自主研发,彻底打破海外厂商在高端高速网络领域的长期垄断。

其网卡支持400G带宽,端到端RDMA时延低至0.9微秒;交换芯片实现64T双向交换容量,转发时延仅260纳秒;交换机端口密度80口400G,比传统方案提升25%;单卡最大QP数256K,是常规的两倍;单子网互连规模为传统IB的2.33倍,可支持11.4万卡集群部署。 同时采用信用机制实现全程无损,链路故障恢复时间小于1毫秒,组网成本下降30%,兼顾高性能与普惠性。

目前scaleFabric已在国家超算互联网郑州核心节点部署,支撑三套万卡级scaleX智算集群上线,总规模3万卡,36小时完成网络部署,运行10个月来累计服务上万客户、承载十万级作业。

中科院计算技术研究所测试显示,它在分子动力学模拟等场景中,单QP通信性能、交换机转发时延达国际顶尖水平;科大讯飞也在推动其与星火大模型适配,依托高带宽低时延特性支撑训练与推理高效运行。