蔚来副总裁吴杰谈到了蔚来和商汤的合作,以及蔚来今年在 AI 领域的规划。别看只有两页简单 PPT,这回料很多:
即将上市的 ET9 利用多模态大模型,实现对车内人员手势的感知。比如在嘴边比一个「嘘」的手势,NOMI 就可以静音了。
这是蔚来和商汤联合开发的技术,用了双目摄像头,可以对车内进行 3D 感知。PPT 上只是个举例,实际上舱内舱外摄像头都已经打通。
他提出了三点展望:
- 2025上半年,蔚来会在车内上多模端到端大模型,会把语音、文字、图形汇成一个大模型更好识别用户的情感。
- 蔚来现有的大模型还是快思考和慢思考两个过程,同时慢思考还有些缺乏。今年也会推整车推理大模型。
- 蔚来暂时不会做狭义上的机器人,但车内的 NOMI 本质上就是个具身机器人,2025 正在规划蔚来的 AICar。