最近在网上看到一个讲智驾算法的视频,视频制作是挺不错的,不过作者可能还是学生,不是在一线搞量产的,所以对于一些实际的量产做法和最新的量产进度并不是很了解,比如他讲的延迟,我今天就展开聊一聊吧。
人要反应时间,那智驾系统要不要反应时间呢?当然是需要的。并且这里要注意一个很关键的口径区别:模型时延≠整个系统的时延。
什么意思呢?从一个事情发生,车的摄像头拍下的那一刻算起,首先处理图像并且输送给智驾芯片,这里就有一点时延;然后是智驾芯片的计算,现在其实很多端到端模型的优化已经很不错,这一步做到300ms内也都不稀奇。
再然后,是把输出的信号交给底盘执行。这一步的时延往往被很多人忽略,觉得“在电线上光速传输,可以忽略”,但实际上首先车辆内部的通信是有固定频率的,比如100Hz就是每10ms发送一次数据,并且有些关键部件的还是国际top供应商提供的(这没办法,像ESP这种安全性部件,很难一下子取代),别人也不直接开放执行器权限给你。所以你要先把信号发给相应的控制器,再由控制器去让执行器执行,这样一层层下来,时延就也不能忽略了。
当然以后如果能进一步做到将这些东西都全部自研,那么时延是有望进一步下降的。但就现在而言,整个系统的“响应时间”普遍是在0.5秒~1秒级别。就比如说从一个突发事件出现,到实际上刹车建压,做出明显减速,大致需要这么长的时间。
那作为对比,“人”这个系统的响应时间要多久呢?这就必须分情况讨论了。如果是“全神贯注等一件事发生”,那么人从看到事情到做出手部动作,反应很快的人的极限反应时间也要200ms左右,如果是做出脚部动作就要约300ms左右了。再加上比如脚踩刹车到刹车泵真正建压至少还要几十ms,整个“系统”的最低响应时间大约在0.3-0.4s。
也就是说,理想情况下,如果你盯着一个地方等一件事发生,而且脚也放在刹车上,随时准备踩下去,那么反应确实是有机会比智驾更快的。有人可能就会说,那我还要智驾干啥?但是——
如果你在观察左边,结果右边出现危险了呢?如果你脚踩的是油门呢?或者你犹豫了一瞬间怕自己踩错呢?毕竟人驾大部分时候踩的都是油门。而且如果有些场景你还要转头观察后视镜呢?这时延一下子就成倍增长了,而智驾可不用看扭头
甚至如果你恰好恍惚了一下,或者是走神了呢?如果都是理想情况,那全国每年就不会有十几万起严重的交通事故了。
实际上,人开车也永远是在“防御”与“效率”直接找平衡。比如夜间经过一堆停着的车,不可能说因为怕鬼探头,就只敢乌龟爬的速度。对于“轻度风险”或者“潜在风险”,“老司机”的方式往往是带一点方向,尽可能离风险远一点,同时控制速度不会开太快。现在的端到端智驾,当然也会学习这种方式。
那你说,“老司机”就一定不会出事吗?当然也不是,一是人有反应极限,刹车还有物理极限。二是如果都是理想情况,还是那句话,就不会有那么多事故了。
人是不可能100%保持最佳状态的,看回放都会觉得“我上我也行”,但实际上,你可以在99.9%的时候都做得很好,而剩下的0.1%呢,只能指望不要运气不好?
这个时候如果有一个辅助驾驶,也能在99.9%的时候做得很好,那么两个合在一起,出问题的概率不是从1‰变成了0.5‰,而是变成了百万分之一。
杠精可能会继续说百万分之1也不是0,但只要实际平时开车的人都知道这个价值有多重要。