据悉,华为的最新AI算力集群解决方案CloudMatrix 384,是基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模A1训练和推理提供了更高效的硬件支持。
由此可见,尽管单颗昇腾芯片性能只为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计,成功实现整体算力跃升,并在超大规模模型训练、实时推理等场景中具备越来越强的竞争力。对面国家继续限制制裁吧,再过两年,我们就什么都有了。