卓驭科技近日在北京车展上发布了原生多模态基础模型。不同于以往智驾行业常说的一段式

卓驭科技近日在北京车展上发布了原生多模态基础模型。不同于以往智驾行业常说的一段式端到端模型，该模型支持视频、文本、动作、语音、地图等多模态信息的统一表征输入，除了用智驾数据做预训练，还覆盖了互联网数据及各类移动机器人数据。

卓驭的原生多模态基础模型也区别于传统需经过语义翻译的 VLA 模型，是在统一框架下完成全模态训练，消除了语义翻译带来的延迟与损耗。

多模态的海量信息输入，提高了模型的泛化能力，卓驭希望通过这个多模态模型覆盖多垂类的应用，从乘用车智驾到商用车智驾，也从汽车到机器人。在出海场景，智驾也可以通过跨国知识输入来认识当地的交通法规，减少适配工作。该模型也将作为卓驭智驾出海的基础模型。

按照卓驭的规划，原生多模态基础模型将于今年内推送至乘用车与商用重卡。据介绍，在商用车领域，卓驭已与国内 TOP 6 重卡品牌建立合作，并与宇通客车联合开发商用客车 NOA 方案。此外，卓驭计划于 7 月与合作方启动城配无人物流试运营，下半年开启搭载原生多模态基础模型的 L4 级 Robotaxi 试运行。汽场全开北京车展潮这看

DC娱乐网

卓驭科技近日在北京车展上发布了原生多模态基础模型。不同于以往智驾行业常说的一段式

热门分类