DC娱乐网

什么是IB?为什么让中国工程师红了眼?

IB可不是什么“爱彼”手表,但在算力圈,它曾经是比爱彼还难买的神器。今天这条,咱们把这个硬骨头啃明白。什么是IB?为什么

IB可不是什么“爱彼”手表,但在算力圈,它曾经是比爱彼还难买的神器。

今天这条,咱们把这个硬骨头啃明白。什么是IB?为什么让中国工程师红了眼?IB,全称InfiniBand(无限带宽),听起来很玄乎,说白了就是:算力集群的高速公路系统。咱们都知道,训练一个大模型,需要成千上万块GPU(图形处理器)像一个人一样协同工作。它们之间要疯狂交换数据——你在算这一层,我要用你算完的结果继续算下一层。

这时候问题就来了:数据怎么传?传多快?会不会堵车?如果普通网络是乡间小道,那IB就是双向八车道的高速公路,具备三大绝活:极低延迟:反应快,指令眨眼就到超高带宽:路够宽,数据不堵车RDMA技术:数据不用在CPU(中央处理器)那里中转,在GPU之间“直送”过去20年,这项技术基本被国外一家公司垄断。你用它的芯片,就得用它的网,每年交巨额授权费,还经常被“限量供应”。最难受的是,人家不卖最先进的给你。这就是所谓的卡脖子——卡的不是某块芯片,而是把这些芯片连接起来的那张网。所以,当3月12日中科曙光拿出全自研的scaleFabric,当新华网点名表扬,当中国工程院院士说“补齐了国产高速网络的短板”——那种激动,只有经历过的人才懂。这不是又做了一个“国产IB”。这是从底层112G SerDes IP、交换芯片到上层协议、软件,每一行代码都自己写的中国路。并行效率85%,碾压RoCE方案的65%,端到端时延低于1微秒。更关键的是,这不是PPT——已经在国家超算互联网郑州核心节点跑了3套万卡集群。以前我们总说好车没好路,GPU再强,一上路就堵。现在,这条国产高速路,通了。算力即国力,基建要自主。这张网补上的,不止是技术空白,更是一口气。#IB是什么 #中科曙光 #scaleFabric发布 #如何破解AI算力焦虑