150种具身机器人轮番登场背后,算力支撑的差距藏不住了
最近具身智能是真火,各种机器人轮番出来秀。我有个朋友做机器人控制的,他跟我吐槽:现在大家光盯着大模型训练多快,根本不关心机器人真机部署的时候怎么不摔跤。
他这么一说,我瞬间懂了。具身智能要闭环:感知→决策→行动。训练感知模型用低精度算力就行,快就完事了。但“行动”之前要大量物理仿真——机器人在虚拟环境里跑几百万次试错,这里必须高精度FP64,误差一点点,真实世界就撞墙。
那问题来了:现在的算力方案里,有几个能同时满足低精度训练和高精度仿真的?
华为昇腾384,12柜384卡,全自研低精度专用。你让它跑训练,它很厉害。但仿真需要的高精度算力,它那个NPU架构天生不擅长。这意味着要做具身智能的全链条开发,你至少得两套系统:一套昇腾跑训练,再找一套超算跑仿真。两套之间数据倒来倒去,效率不说,成本翻倍。
中科曙光那个万卡集群反而让我觉得思路对路。int8到fp64全精度,一套系统把训练和仿真都包了。6万卡那个集群已经在跑十亿级网格仿真,效率从周级提到小时级。这不就是具身智能需要的“训推仿一体化”底座么?
我朋友最后说了一句特实在的话:谁能让机器人从仿真到真机一次过,谁才是具身智能的真大腿。现在看,单精度的选手怕是抱不上这条腿了。
