这两天微博上吵架,确实把小鹏的一项很有意义的世界模型创新给盖过去了。
其实重要的一件事情是,世界模型从架构设计本身,就决定了运行效率非常低,非常低。
为什么?
现在主流的世界模型主干一般是DiT,然后用自回归做的,必须上一段结束才能生成下一段。
同时为了多个摄像头,例如小鹏的世界模型7路同时输出,还要考虑多视角一致性。
推理速度显而易见很慢。
小鹏直接发了XCache来处理这个问题 ,理由也很简单 现实世界很多画面前后是没有变化的。
就是下一个片段如果长得像,那就用这个部分,就跟打开网页缓存一样,上次打开过就不用重新加载了。
这样就能加快生成的速度。
这就是小鹏的创新。说明小鹏真的在努力提升世界模型训练上的效率。世界模型不是宣传手段,贡献者也都来自小鹏。
提高了训练效率后,期待下一个版本的小鹏辅助驾驶系统的表现。
新能源大牛说智驾体验
