端侧动态数据流架构+3D Vit架构=理想具身智能的利刃?
今天理想发布会没有及时看到,回来以后抓紧时间复习了一遍,觉得一如既往,理想还是把细节说的很好,这一点真的非常认同,让人一看就很有代入感,而且用视频这种模式其实成本和效率都更高,我个人理解以后都不需要什么现场发布会,视频更清楚更明白更直接。
全面的信息就不用讲了,来聊聊最感兴趣的理想辅助驾驶上的变化吧,觉得主要就是两点:
1.端侧动态数据流架构2.3D Vit
我们先来说说第一个,理想全新一代L9的马赫M100芯片上采用了一种新的底层架构,全称叫做“端侧动态数据流架构”,这个一看有点复杂,其实拆开来看也没有那么难懂:
(1)端侧,这个简单,就是搭载在车上本地,不依赖云端,可以提供更加稳定和可靠的保障。
(2)数据流,我理解这是新架构最核心的地方,也是和传统的GPU不同的地方。
传统的GPU更多的都是采用控制流,你可以把它理解成厨房里有个大师傅,拿着菜谱大喊:“所有人注意,第一步,切洋葱!” 于是切菜工去仓库(内存)拿洋葱,切完放回仓库。厨师长又喊:“第二步,炒洋葱!” 炒菜工再去仓库拿切好的洋葱……
现在的数据流模式下,切菜工只要看到洋葱过来了,立刻切,切完直接顺着流水线递给炒菜工,炒菜工接过来就炒。大家各司其职,数据就像流水一样顺着管子往下走,不需要频繁地去仓库(内存)存取。这种模式下,效率直接拉满!因为省去了大量来回搬运数据的步骤,它的处理速度极快,而且极度省电。
(3)动态,这个同样重要,相当于有个聪明的调度员。
在传统的架构里,流水线是被写死了的顺序,比如今天突然来了100个要做红烧肉的订单,但只有1个切肉工和10个洗菜工,洗菜工只能眼巴巴看着切肉工忙死。
但是在动态的情况下,一看红烧肉订单多,能瞬间把闲置的洗菜工全部分配去帮着切肉,让整个厨房的运算能力永远处于满载且最合理的状态,绝不浪费一丝一毫的算力。
在这种数据流架构下,马赫M100用相当低的能耗跑出了超强的算力结果,举个例子,当马路上突然窜出一辆电动车(海量视觉数据瞬间涌入),“数据流”流水线能比传统架构快得多的速度处理完这些图像,而且它减少了大量无效的“跑腿”工作(内存读写),处理极度复杂的AI大模型时,芯片也能保持冷静(少发热低能耗),从而在最短的时间内为你踩下刹车。
再来说说第二个3D Vit,这个里面的3D大家应该一看就明白,就是把传统的平面照片变化成立体物体,比如在这个情况下,前方的车不是一个“逐渐变大的矩形”,而是一个有长宽高、占据真实物理体积的“3D方块”。
Vit的意思其实就是Vision Transformer,强调全局理解,这里其实和人的注意力集中有点类似,比如你走在繁华的步行街上,你的眼睛其实接收了所有的画面(天空的云、路边的树、闪烁的霓虹灯),但你的注意力会自动锁定在那个正向你跑来的小孩,或者即将撞上的电线杆上。
而3D Vit算法也是一样,拥有类似人类的“注意力机制”,它能在瞬间扫过整个 3D 沙盘,自动判断哪些信息是关键的、哪些是无关紧要的背景。它会把有限的算力死死盯住那个可能突然冲出马路的行人,从而大幅降低误判和漏判,提升驾驶的安全感。
一句话总结,3D ViT 模型就像是给了汽车一双“自带空间感、懂得抓重点、还能预测未来”的上帝之眼。
这里还值得一说的是,理想这套全新的辅助驾驶体验,可以根据前序不同算力的车型进行适配,从Orin X到单Thor在今年下半年都可以落地,当然体验上根据不同的算力,会有差异,这一点对老车主的友好度还是可以的。
理想的辅助驾驶体验一直不算特别稳定,好的时候表现非常惊艳,但也有时候表现的和预期有不少差距。这次正式切换到全新的软硬件之后,期待理想辅助驾驶的表现可以更加稳定。
至于全新一代L9的价格,我感觉蔚小理完全是商量好的节奏,每家的旗舰都和另外一家拉开了差距,以适配不同的用户需求,理想L9似乎是在中间承上启下的那一个。
今年理想真的是不一样了,技术说的又多又细,挺有意思的,明天去店里看看livis表现如何。回来再给大家报告。全新理想L9Livis上市、全新理想L9定价45.98万








