当模型具备以下原子能力,管它叫什么VLA、第二代VLA、WA、NWM或者其他什么,这些都不重要了,
1. 响应快、低时延,
2. 具备场景理解的“泛化性”,模型不仅“见过能认识”,还可以通过“理解本质再类比”,处理之前没见过的场景,
3. 能听懂“人需要怎么开车”,把语言瞬间变成驾驶策略,
4. 模型的可解释性+可验证性,
5. 能持续挖掘和回传 corner case,
6. 可在车端部署,
7. 参数增长后,训练能持续增量演进,而不是重来一遍,
(欢迎讨论补充)

当模型具备以下原子能力,管它叫什么VLA、第二代VLA、WA、NWM或者其他什么,这些都不重要了,
1. 响应快、低时延,
2. 具备场景理解的“泛化性”,模型不仅“见过能认识”,还可以通过“理解本质再类比”,处理之前没见过的场景,
3. 能听懂“人需要怎么开车”,把语言瞬间变成驾驶策略,
4. 模型的可解释性+可验证性,
5. 能持续挖掘和回传 corner case,
6. 可在车端部署,
7. 参数增长后,训练能持续增量演进,而不是重来一遍,
(欢迎讨论补充)
