刷完原力灵机发布会,想起之前读范浩强访谈,挺多感触的。
他说"模型决定场景,场景定义硬件",今天看DFOL就是按这个逻辑跑的。不是先造个万能机器人再找用处,是先看模型能干啥,再挑能落地的场景。一个分拣零件的case,"可口可乐"换"百事可乐"能泛化就行,不完美,但省掉5个月换线时间,客户愿意买单。
访谈里他提过公司有个"功勋榜",记录谁采的数据最多。采集员要练到"人机合一",零点几毫米对准精度,苦练两天才能上手。这种较真劲,和当年旷视做人脸识别做到11个9的偏执一模一样。
他自己也跑客户,和唐文斌一起下工厂,找"客户场景里的最简单问题"。结果发现最简单的比table30最难的还难——比如"把两个扣在一起的东西翻个面",模型根本学不会。这种反常识的认知,只有真跑过现场的人才说得出来。
我这些年从汽车转AI机器人,最大的教训就是早期总想自己干。后来才明白,找懂闭环的人比找最厉害的更重要。对的人进来,一周跑通的事,自己摸索三个月。原力灵机发布会一本书读懂人形机器人杨宽百位具身智能朋友
