为高性能计算(HPC)选择InfiniBand产品的建议

通信飞飞飞 2024-03-06 23:09:19

在Computex 2023期间,英伟达(NVIDIA )推出了一系列先进的产品,包括先进的芯片、超级计算架构和复杂的交换机。特别值得关注的是强大的人工智能超级计算机NVIDIA Helios。它利用Quantum-2 InfiniBand网络,准确地连接四台DGX GH200系统,极大地提升大规模人工智能模型训练的效率。

各种指标表明,数据中心正在向加速计算发生决定性转变,这一趋势是由人工智能与高性能计算(AIGC)推进的。为了满足高性能计算、人工智能和庞大基础设施不断增长的需求,对加速互连和更智能的网络解决方案的需求随之增长。在这一背景下,InfiniBand产品因能满足这些迫切需求已成为行业关注的焦点。

InfiniBand的基础知识

InfiniBand是一种高速、低延迟的互连技术,主要用于数据中心和高性能计算(HPC)环境。它提供了一个高性能结构,用于连接集群或数据中心内的服务器、存储设备和其他网络资源。InfiniBand技术的出现与传统TCP/IP协议相关的大量网络延迟和额外的操作系统成本密切相关。

传统的TCP协议是一种被广泛应用的传输协议,其应用范围从冰箱等日常电器到复杂的超级计算机等一系列设备。然而,其应用常伴随着巨大的成本,原因为TCP协议复杂多变,代码庞大,异常繁多,且难以卸载。

相比之下,InfiniBand采用基于信任的流量控制机制,能够确保连接完整性并尽可能减少数据包丢失。在InfiniBand环境下,只有当接收缓冲区有足够的空间时,才会进行数据传输。数据传输完成后,接收方会发出缓冲空间的可用信号,从而消除与初始数据包丢失相关的重传延迟。这种方法显著提升了效率和整体性能。

市场上的InfiniBand

InfiniBand技术是在InfiniBand贸易协会(IBTA)的监督下开发的,该协会专门负责维护和推广InfiniBand标准。此外,InfiniBand贸易协会还确保合规性,并对商业InfiniBand产品进行互操作性测试。在InfiniBand贸易协会的九位主要董事中,只有两家公司——迈络思(Mellanox )和Emulex——致力于InfiniBand。由于经营业绩不佳,Emulex于2015年被Avago收购。目前,迈络思(Mellanox )在InfiniBand市场占据主导地位,其产品的集群部署数量远远超过其竞争对手。

InfiniBand的主要优势

总体而言,InfiniBand技术具有以下优势:

高速和可扩展性低延迟低功耗高性能计算(HPC)网络中的InfiniBand

在高性能计算(HPC)领域,高速互连网络(HSI)在系统性能和效率方面发挥着至关重要的作用。其中,InfiniBand技术凭借其优良的性能,已成为高性能计算中广泛应用的关键组件。作为提升效果显著的高速互联网络技术之一,InfiniBand能够提供高达200Gbps的带宽和小于0.6ms的点对点延迟,为构建高性能计算集群提供了强大的支持。

借助InfiniBand的高速组网能力,高性能计算系统可以有效地组合多台服务器,实现线性性能可扩展性。该技术在高性能计算集群的开发中起着重要的作用,特别是在超级计算机的构建中。企业以及大型或超大型数据中心都受益于其高可靠性、可用性、可扩展性和卓越性能。因此,InfiniBand技术在高性能计算领域的重要性不仅体现在提升计算集群的性能上,还体现在为不同规模的数据中心提供关键支撑,推动高性能计算生态系统的整体发展。

市场上的InfiniBand产品销售商迈络思(Mellanox ) (被英伟达(NVIDIA )收购)

迈络思(Mellanox )是InfiniBand(IB)领域的领先企业,于2020年4月被英伟达(NVIDIA )收购。迈络思(Mellanox )产品的官方购买平台是英伟达(NVIDIA )官网店铺。这家网店高效可靠,提供各种连接器。但是,某些产品可能无法在官方网站上直接获得。如果官方网站上没有产品,客户可以选择从英伟达(NVIDIA )合作伙伴处购买。

英伟达(NVIDIA )合作伙伴网络

英伟达(NVIDIA )的合作伙伴是时下市场解决方案和产品的主要供应商,包括InfiniBand线缆和光模块。InfiniBand线缆和光模块通过英伟达(NVIDIA )授权分销商/经销商网络在全球范围内分销。有关分销商/经销商的信息可以在英伟达(NVIDIA )官方网站上找到。尽管分销商/合作伙伴与英伟达(NVIDIA )之间合作密切,仍可能会出现连接器短缺、市场供应不足和交货周期长等问题。

飞速(FS)

飞速(FS)是英伟达(NVIDIA )的精英合作伙伴,在其官网上提供了丰富的InfiniBand产品,包括英伟达(NVIDIA )InfiniBand交换机、InfiniBand模块 、InfiniBand线缆 和英伟达(NVIDIA)InfiniBand网卡 。飞速(FS)拥有充足的InfiniBand产品库存,并确保快速交付。如果您想购买InfiniBand产品或获取InfiniBand解决方案,可以联系飞速(FS)寻求帮助。

选择InfiniBand产品的建议

InfiniBand产品在高性能计算数据中心中发挥着至关重要的作用,选择合适的产品对于运营成功至关重要。全面的InfiniBand系统包括InfiniBand交换机、InfiniBand网卡、InfiniBand以太网网关、InfiniBand线缆和光模块、InfiniBand遥测和软件管理以及InfiniBand加速软件。

选择合适的InfiniBand产品对于高性能计算数据中心至关重要。考虑包括带宽和距离要求、连接器、预算、兼容性、可靠性和未来需求在内的因素能够有助于选择合适的InfiniBand连接器。

关于InfiniBand网络互连产品:

DAC高速铜缆为短距离、高速互连提供了经济的解决方案。AOC有源光缆利用光学技术进行更远距离的数据传输。光模块通常用于长距离、高速互连。

了解不同的产品品类、速度和封装模块有助于做出明智的决策,而选择合适的供应商可确保获得符合性能和预算要求的高质量InfiniBand产品。

InfiniBand或以太网:InfiniBand更适合HPC计算

一些用户仍然对在HPC计算能力中使用InfiniBand还是以太网有疑问。实际上,对于高性能计算,InfiniBand更合适。

在高性能计算(HPC)领域,InfiniBand在几个关键方面表现出优于以太网的优势:

流量控制机制

InfiniBand采用端到端的流量控制,确保消息在传输过程中不会拥塞,从而实现无损网络。相比之下,以太网的流量控制机制相对简单,可能导致拥塞和数据丢失。

网络拓扑优势

InfiniBand在其第2层网络中引入了一个子网管理器,能够配置节点的本地ID并通过控制平面计算/分发转发路径信息。这有助于轻松部署大规模网络,避免泛洪、VLAN或环路中断问题。这为以太网上的InfiniBand带来了独特的优势。

性能参数

InfiniBand提供更高的带宽、更低的延迟和更少的抖动,使其成为HPC环境中快速可靠数据传输的理想选择。与以太网相比,InfiniBand拥有更快的数据传输速率,从40G到400G,而以太网目前仅限于100G。

GPU工作负载的适用性

InfiniBand更适合处理GPU工作负载,从而实现CPU和GPU之间的高速数据传输。这对于需要大量计算能力的任务尤为重要,因为以太网这这方面表现较弱。

支持并行计算

InfiniBand允许多个处理器同时通信,展示了并行计算的优良性能。这对于需要大量并行计算能力的应用至关重要。

全球HPC TOP500排行榜

根据近来的全球HPC TOP500排行榜,InfiniBand的市场份额一直在稳步上升,目前在TOP100中占据主导地位,而以太网的市场份额则在下降。

结论

目前,我们正处于人工智能和通用计算(AIGC)蓬勃发展的时代。OpenAI、Microsoft和Google等主要平台巨头,以及Midjourney和Character Al等专注于应用程序的公司,正在加速AI应用程序和服务的开发和演进。此外,新公司和新应用的迅速涌现在人工智能领域营造出高度竞争的氛围。

显而易见,计算能力在决定生产力方面发挥着至关重要的作用。目前,英伟达(NVIDIA )InfiniBand产品明显供不应求。为满足您企业的业务需求,选择合适的供应商和InfiniBand产品至关重要。

0 阅读:0

通信飞飞飞

简介:感谢大家的关注