DC娱乐网

说在前面,对AI我非专业人士,业内人士的交流讲究效率,专业词汇太多,作为用户层面

说在前面,对AI我非专业人士,业内人士的交流讲究效率,专业词汇太多,作为用户层面,第一次看见专业词汇根本看不懂,咱们就大白话讲理想汽⻋基座模型负责⼈詹锟在2026GTC⼤会(英伟达主办的聚焦AI的年度大会)上,发布了下⼀代⾃动驾驶基础模型MindVLA-o1在物理世界中,AI进展缓慢的一个重要原因,就是对于预训练的思考不够。目前绝大多数视觉训练是基于看二维图像或者视频,能看懂文字语义,但是不能真正理解真实三维世界。举例:就像我平时拿显示器玩赛车模拟器,对于路线把控,刹车点都需要适应;而如果拿头戴VR玩,他是三维的,有空间纵深感,非常容易找到空间适应能力,代入感非常强,不过很多人会晕…那对于理想来说他们的解决方案就是3D ViT+多模态,就相当于人在真实世界开,效果肯定好得多,但是这会增加大量的算力消耗,相比2D模型,3D ViT算力要增加10倍…(玩VR也知道非常吃显卡…)这就需要用到理想的马赫100芯片了,单颗1280TOPS算力,有效算力是英伟达Thor-U芯片的三倍,21年开始研发,26年随全新一代理想L9上车…再就是多模态思考能力,再举例:我这i6遇到路上左侧是公交道,路牌上限时早上7:00-9:00私家车不能走,这需要看懂图像再进行语言推理,理解哪些时候能走、哪些时候不能走(现在已经可以),不具备这个能力的车上去,看到公交车道就会直接往右变道…当然不仅仅是纯语⾔的思考,语⾔擅⻓处理抽象概念和逻辑关系,但在理解具体、形象化的物理空间关系时,还需要依赖对场景的想象和空间推演能⼒,这同样属于思考的⼀部分。理想汽⻋将语⾔推理与空间理解等能⼒融合,形成新⼀代的多模态思考框架。今年年中这⼀能⼒将与3D ViT结合,使模型能够真正理解三维空间并具备更完整的3D认知能⼒。李想称机器人也用VLA理想发布下一代自动驾驶基础模型李想回应AI时代的焦虑