英伟达发布“全能”世界模型 机器人自动驾驶获强力助推
---------
据报道,6月1日,英伟达发布了Cosmos 3——一款基于突破性Transformer混合架构的物理AI世界模型。据悉,Cosmos 3是全球首个完全开源的全能模型(Omni-Model,也叫全模态模型)。其能够以领先的物理精度原生理解和生成文本、图像、视频、环境声音和动作,将物理AI的训练和评估周期从数月缩短到数天。
点评:物理AI是人工智能下一步演进方向。世界模型和空间智能将为物理AI提供感知和认知三维世界的基座。得益于多模态推理语言、视觉和世界模型的突破,物理AI的爆发式增长指日可待。Cosmos 3将使开发者在构建机器人、自动驾驶汽车和视觉人工智能方面实现代际飞跃,从而在物理世界中感知、推理、规划和行动。据英伟达测算,物理AI对应制造与物流产业重塑空间约50万亿美元;据投资机构Coatue Management测算,物理AI市场规模基准为6万亿美元。