DC娱乐网

卓驭科技近日在北京车展上发布了原生多模态基础模型。不同于以往智驾行业常说的一段式

卓驭科技近日在北京车展上发布了原生多模态基础模型。不同于以往智驾行业常说的一段式端到端模型,该模型支持视频、文本、动作、语音、地图等多模态信息的统一表征输入,除了用智驾数据做预训练,还覆盖了互联网数据及各类移动机器人数据。

卓驭的原生多模态基础模型也区别于传统需经过语义翻译的 VLA 模型,是在统一框架下完成全模态训练,消除了语义翻译带来的延迟与损耗。

多模态的海量信息输入,提高了模型的泛化能力,卓驭希望通过这个多模态模型覆盖多垂类的应用,从乘用车智驾到商用车智驾,也从汽车到机器人。在出海场景,智驾也可以通过跨国知识输入来认识当地的交通法规,减少适配工作。该模型也将作为卓驭智驾出海的基础模型。

按照卓驭的规划,原生多模态基础模型将于今年内推送至乘用车与商用重卡。据介绍,在商用车领域,卓驭已与国内 TOP 6 重卡品牌建立合作,并与宇通客车联合开发商用客车 NOA 方案。此外,卓驭计划于 7 月与合作方启动城配无人物流试运营,下半年开启搭载原生多模态基础模型的 L4 级 Robotaxi 试运行。汽场全开北京车展潮这看