时隔五年,全球顶尖AI计算技术盛会、年度NVIDIA GTC大会重磅回归线下,吸引了全球众多AI行业精英和技术大牛。3月18日,英伟达创始人兼CEO黄仁勋在演讲中发布了AI芯片最新力作——Blackwell GPU,引发了业界广泛关注。
AI芯片新皇登场Blackwell GPU作为英伟达的新一代旗舰产品,集成了2080亿颗晶体管,采用定制台积电4NP工艺,以统一内存架构+双芯配置为基础,将2个GPU die通过10TB/s芯片间NVHyperfuse接口相连,单卡AI训练算力可达20PFLOPS。
相比前代Hopper GPU,Blackwell GPU在性能上有着显著提升,具备了更高的FP4精度推理能力,实现了训练性能提升至2.5倍,推理性能提升至5倍。此外,第五代NVLink技术的升级,使得Blackwell GPU能够支持多达576个GPU间的无缝高速通信,解决了万亿参数混合专家模型通信瓶颈的问题。
全新Blackwell平台除了Blackwell GPU之外,英伟达还推出了Blackwell平台的“全家桶”,包括全新网络交换机X800系列、GB200超级芯片、DGX B200系统等。X800系列网络交换机以其高达800Gb/s的吞吐量和支持万亿参数级生成式AI业务的能力,成为了AI基础设施的重要组成部分。
而GB200 Grace Blackwell超级芯片则专为万亿参数规模生成式AI设计,通过与Blackwell GPU的连接,实现了性能提升和成本降低的双重优势。此外,英伟达还推出了下一代DGX SuperPOD AI超级计算机,为超大规模生成式AI训练和推理工作负载的持续运行提供了有力支持。
企业级生成式AI微服务除了硬件产品,英伟达还发布了数十个企业级生成式AI微服务,为开发者提供了便捷的定制和部署AI模型的途径。这些微服务不仅在英伟达大型CUDA安装基础上工作,并针对新的GPU进行了优化,还支持行业标准的API,使得开发者能够在自己的平台上创建和部署自定义应用程序,保留了对知识产权的完全所有权和控制权。
光刻计算新革命在与台积电、新思科技等巨头的合作下,英伟达还推出了计算光刻技术的突破性进展。通过cuLitho加速流程,结合生成式AI算法,成功提升了工作流速度,并将整个OPC过程加快了2倍,大大改进了芯片制造工艺,提高了吞吐量,加快了生产速度,降低了成本和功耗。
具身智能机器人引领未来除了芯片技术,英伟达还对具身智能机器人充满信心,发布了人形机器人通用基础模型Project GR00T和基于Thor SoC的新型人形机器人计算机Jetson Thor。这些技术的应用,将使得机器人能够更好地理解自然语言,并通过观察人类行为来模仿快速学习,以适应现实世界并与之互动。
总结英伟达此次GTC大会的重磅发布,不仅展示了其在AI领域的领先地位,更为行业未来的发展指明了方向。从Blackwell GPU的性能突破到生成式AI微服务的推出,再到光刻计算技术的革命性进展,英伟达不仅在硬件技术上不断创新,还通过软件和服务的完善,为AI行业的持续发展注入了新的活力与动力。
随着人形机器人技术的不断成熟,未来可期,英伟达定将继续引领AI技术的发展潮流,为人类社会的进步贡献更多力量。