DC娱乐网

据我所知,虽然之前有中间“L”的那种“VLA”也吹了很久,但其实都没有真正上车,

据我所知,虽然之前有中间“L”的那种“VLA”也吹了很久,但其实都没有真正上车,实际用法可以理解为是用一个小的VLM/语音模型,给传统的端到端VA模型加了一路输入。就好像导航信息是模型的一路输入一样,文本信息也可以作为一路输入,仅此而已。传说中的“V-L-A”可能从来都没有真正落过地,真正在控车的都是传统的端到端模型。。。