从理想 i8 ,思考理想下一代车机的变化。
开 i8 的体验比较长,也对理想智能交互有一些新的思考,和大家分享一些小的想法。
1、车机控制从多步骤到 0 层级。
理想一个很重要的变化其实是语音,理想的语音感觉是最容易被忽略的。现在语音基本上所有控制类或者应用的调用,都可以直接完成语音控制。
很多细节的部分,比如我要执行听歌,但要求播放网易云音乐的App,包括要听里面的我喜欢的音乐的列表的歌单,比如喜欢听哪个博客精确到哪个内容都可以等等,除了车控以外,应用的抓取也做的非常细。
其次语音的反馈也做的很好,基本上所有需求都有对应的回答。而这种交互带来一个新的体验,就是弱化交互甚至带来 0 层级的交互。甚至过去我们车机里一直觉得重要的交互逻辑问题也基本没有了,减少很多跳转。
当然聊到这里,我们总会感觉少点什么。
特斯拉 Grok 和 FSD 一样的交互什么时候来?现在车机的瓶颈从来不是功能不够多,而是理解不够深。因为车机最难的部分,不是 “能不能执行”,而是 “知不知道要执行什么”。
我们把问题进一步拆解。车机需要一只手,这只手能帮我们开空调、控制车窗、打开某个应用。因为这些其实都是标准化的接口,所以现如今大家都能做好,拼的都是工程量,理想明显花的更多,所以这只手触达的更多。但是要学会理解,就意味着要一个“脑袋”。
脑袋就是理解能力,理解人类自然意图,现在传统语音助手 90% 都听不懂。所以大脑需要有大模型或者先进模型的推理,然后进一步认知场景,然后模型可以自己去调用自己的手,这才是一个好的终极形态。
所以行业普遍的是模型很弱,只能识别一些固定指令,推理很难,但是另一边是工具非常全,就是有手,功能啥都能做,下一代的语音Agent化,就是把工具手的能力,和大脑的理解能力做融合。
谁融合出来,就能做到打破现有的体验,而且相信这也是理想现在在坚决推进的首要任务。
2、舱驾融合,为什么重要?
特斯拉的交互给我们带来很多新的启发。国内能不能达到,甚至做的更好?我觉得这是必然。
蔚小理三家都在做一件事就是基座模型 + 中间件 + 应用层的开发结构,卷下一个阶段就是效率应用,这点还是很有信心。
舱驾融合从大家一直说的硬件平台,现在是要真正走向软件和体验的融合,起码给我们看到一个方向。大家不再满足通用的第三方AI方案,因为大家发现上豆包、上DS无非就是在车机嵌了个 APP,很不好用。
而 FSD 和 Grok 共享的不仅是传感器、时间戳、决策链路,它甚至就是整个车辆操作系统的一个部分,但现在我们遇到的问题是车控是一堆信号,智驾也是另一套API,但是第三方大模型厂商也没有进场没有车的积累,而普通车企也不懂调用大模型工具,所以一直没人能把整车能力封装成一个大模型能理解的工具。
就是没有一个能和脑协作的手。 模型一旦理解不了,工具再强也没什么用。
理解了这点可以明白Grok不是一个简单车机助手。它有大量整车多模态的数据,也有社交X平台的实时数据,未来的体系竞争是能不能从芯片到操作系统,从数据、整车权限到工具链的打通,只要其中一个工具链是断裂的,那体验是碎的。
所以我一直认为,硬件始终只是一个载体,像车本身一样,未来车上 AI 的竞争,就是如何快速的在不同平台或者硬件下快速效率落地。
舱驾一体把所有工具变成一套可统一调用的工具集。大模型想调哪个就调哪个,这种原生的智能也会带来变革式的体验,这点我觉得是理想正在做的。
3、理想的生成式桌面,大横屏的下一代交互。
过去我们打开一个应用,要好几层,其实设置一个功能也是,很多车机我们还要学习。
但随着大家功能变多,大家发现很多功能开始放在桌面,比如有卡片,有dock,也有负一屏,甚至还有多桌面。桌面越来越丰富,也越来越复杂。
理想有一个很重要的功能就是生成式卡片。它通过大模型对用户的理解对环境多模态感知进行实时理解与决策,自己动态渲染一套 UI 界面,并统一调度整车工具能力,实现一个闭环,导出一个卡片。
相比过去传统桌面,它的前端是被写死的,需要用户操作才能执行。
理想下一代车机就要连屏了,基本可以猜到理想的车机桌面的变革,就是从过去的 “固定布局 + 预设组件” 升级成一个可动态生成、高度个性化的交互桌面,
虽然现在大家感知度不高,但未来所有功能和服务都可以变成卡片,比如我生成了一个仪表,带续航显示,要有wltc。它自己生成,不需要纠结仪表的位置。
我因为每次感觉理想的按摩很深,我直接生成一个按摩卡片再桌面。它可以是临时,也可以是常驻卡片。
而且每个用户的千人千面。可以不同理解,传统车机是你去适应它,生成式桌面可以适应你更多个性化需求。结合语音,可以直接完成定制,也可以减少交互步骤。
L9 Livis 的重要性我觉得不言而喻,作为理想下一代座舱的理解,有更多期待。
理想汽车理想l9理想i8





