蔚来世界模型NWM,问必答第三期。
NWM和VLA的关系:World Model(世界模型)的核心,是通过视频预测或其它方式,学习真实世界本质的时空规律。我们在2024年的NIO IN上所说的蔚来世界模型,是一个多元自回归生成模型,输入多模态数据,多模态包含图像和语言等,同时能输出多模态数据,包含图像和行动等等。
所以,当蔚来世界模型打开语言输入时,它就包含了VLA视觉语言行动模型的特征。
一句话:友商宣传的VLA属于蔚来NWM的一部分。
另外,据不具名群聊记录显示,Banyan新版本已经提交工信部审核。