小鹏汽车联合北京大学提出全新视觉Token剪枝框架FastDriveVLA

上证报中国证券网讯（记者俞立严）12月28日，小鹏汽车介绍，近日，AAAI2026公布了论文录用结果，该会议是人工智能领域的国际顶级会议之一。AAAI2026共收到23680份论文投稿，其中4167篇论文被录用，录用率仅为17.6%。由小鹏汽车和北京大学计算机学院多媒体信息处理全国重点实验室联合完成的论文《FastDriveVLA:EfficientEnd-to-EndDrivingviaPlug-and-PlayReconstruction-basedTokenPruning》成功入选。这篇论文的主要贡献在于，提出了一种专门为端到端自动驾驶VLA模型定制的、高效的视觉Token剪枝框架——FastDriveVLA。

随着AI大模型技术的加速演进，VLA（视觉-语言-动作）模型由于在复杂场景理解与动作推理方面展示出巨大潜力，正在被广泛应用于端到端自动驾驶系统中。VLA模型在处理视觉信息时，会将图像编码为海量视觉Token（词元）。视觉Token是VLA模型“看懂世界”，并“做出决策”的基石，其质量、数量与选择策略直接决定了模型的性能、效率与可信度。然而，直接转换的处理方式会导致车端计算负荷变大，同时，还会影响模型的推理效率和决策执行。

此前，视觉Token剪枝已被证实是加速VLA模型推理的可行方法之一。但传统的视觉Token剪枝方法或依赖文本-视觉注意力关联，或基于Token相似度去重，在驾驶场景中均存在明显局限。为了解决这一问题，小鹏汽车联合北大共同提出FastDriveVLA——一种专门为自动驾驶设计、基于重建视觉Token剪枝框架。该框架的提出受到人类驾驶员在驾驶时会专注于相关前景信息（如行人、道路、车辆、交通标志、交通信号灯、交通障碍物）的启发，引入了一种新颖的对抗性前景-背景重建策略，以增强VLA模型识别有价值Token的能力，从而教会AI“像人一样开车”，自动过滤无关紧要的视觉信息，只关注有用的核心信息。

小鹏汽车联合北大提出FastDriveVLA，建立了自动驾驶VLA模型的高效视觉Token剪枝的新范式，同时树立了车端大模型高效部署上车新标杆。

此次论文入选AAAI2026，是小鹏汽车2025年第二次参与人工智能领域的国际顶级会议。2025年6月，小鹏汽车曾作为CVPRWAD唯一邀请演讲中国车企，分享自动驾驶基座模型的研发进展。在2025年11月的科技日上，小鹏汽车正式推出第二代VLA，创新性去掉了“语言转译”环节，首次实现从视觉信号到动作指令的端到端直接生成，颠覆了行业传统的“V-L-A”架构，探索全新物理AI模型范式。这些成果都为全球自动驾驶研究和实践注入了全新动力。

小鹏汽车介绍，这一系列成果体现了公司从模型架构设计、模型训练到模型蒸馏、部署上车的全栈自研能力。未来，小鹏汽车将继续以L4为目标，在AI大模型领域加大投入，加速物理AI大模型上车，让更安全、高效、舒适的智驾体验惠及全球用户。

DC娱乐网

小鹏汽车联合北京大学提出全新视觉Token剪枝框架FastDriveVLA

热门分类