AMD正式发布升级版的Instinct MI325X AI加速卡,还披露了下一代Instinct MI350系列的首款产品Instinct MI355X的核心规格及性能数据,其将在2025年下半年上市。
近年来AMD的AI加速卡得到了大规模应用,MI300系列成为AMD历史上增长最快的产品,因此像英伟达一样,现在每年都会推出新产品。
AMD表示这是一次“从头开始的重新设计”,Instinct MI355X采用CDNA4全新架构,升级台积电最新的3nm工艺,首次引入FP6、FP4浮点数据类型,将支持高达288GB的HBM3E内存。
MI300X目前提供1.3 PFlops的FP16计算和2.61 PFlops的FP8,MI355X将这些提升到2.3和4.6 PFlops。与上一代相比,这是一个77%的提升。需要注意的是,MI325X的计算能力与MI300X相同,只是HBM3E内存提高了33%和更高的TDP。
MI355X不仅仅有更强大的原始计算能力,引入FP4和FP6将FP8的潜在计算能力再次翻倍,因此单个MI355X提供高达9.2 PFlops的FP4计算。这是一个有趣的数字,因为Nvidia Blackwell B200也提供9 PFlops的密集FP4计算,而更高功率的GB200实现每个GPU提供10 PFlops的FP4。
仅基于这个规格,AMD将有可能与英伟达的Blackwell一样,用MI355X提供大致相同的AI计算能力。不过,AMD还将提供高达288GB的HBM3E内存,这比英伟达目前为Blackwell提供的多50%。Blackwell和MI355X每个GPU都将有8 TB/s的带宽。
当然,AI不仅仅是计算、内存容量和带宽,扩展到更高数量的GPU通常在达到某个点后成为限制因素。目前还没有关于AMD是否在GPU之间的互连上做了任何改变的消息,这是英伟达在宣布Blackwell时谈论的相当多的事情,所以这将是值得关注的点。
关于AMD正式推出的MI325X,将在本季度全面生产。AMD将每个GPU支持的最大内存从288GB(其之前声明的)减少到256GB。MI300X到MI325X的主要变化是每个GPU的内存容量,MI300X提供192GB。所以最初,AMD希望MI325X有50%的增长,但现在已经减少到33%的增长。
AMD展示了一些将MI325X与Nvidia H200进行比较的性能数据,单GPU性能略有领先,8个GPU平台性能持平。