5分钟读懂具身智能:一张XYZ曲线图和5个判断
具身智能这个赛道,眼下可以说是红的发紫。五一假期闲来无事,翻了翻具身智能行业的融资月报。单单4月份就有41笔融资,远超去年同期的16笔。开年到4月底的融资额更是超过了去年全年。真金白银在加速涌入这个行业。热钱是风,风接下来会往哪儿吹?站在5月回看,比融资数字更值得重读的,是前不久鲜少公开露面的智元掌门人邓泰华那场近两小时的发言。怎么理解具身智能走到了哪,未来将会向哪里去?邓泰华的XYZ曲线可能是目前最清晰的一张路线图:
按照那天他的原话,厂哥简单拆解了下:X曲线——行业还处在“能动的”尝鲜期。 机器人像人一样动起来,走秀、表演、进实验室,这是前三年的事。越往后空间越有限,边际效应是递减的。Y曲线——行业进入会干活的“部署期”。“不仅能动起来,还能像人一样能干活”——X到Y是质变。这个阶段不再是花拳绣腿,开始有了真实落地场景。Z曲线——行业进化到能涌现的“普及期”。 部署数量够大、场景数据够丰富、算法持续创新,机器人有望通过“物理世界图灵测试”,迎来具身智能的“ChatGPT时刻”。总结:X是“能动”,Y是“会干”,Z是“能涌现”。世界杯 除了XYZ曲线这张路线图,邓泰华那场近两小时的演讲里,还有几个值得记住的判断。有些话其实还挺激进的,厂哥简单梳理了下。判断一:2026年是“部署态元年”——这是整场最重的一句话。过去三年,机器人更多在“秀”:走秀、表演、进实验室。但邓泰华说,今年是个分水岭,具身智能正式从“能动”走向“会干”。判断能不能干活,标准只有一个:有没有真实场景落地。判断二:智元的底色不是机器人公司,是AI公司。这个定位区别挺大。他的原话更直接——“智元是具身智能的基础模型公司,模型需要有一个载体,所以我们做了相配套的本体。”这句话反过来读更有意思:不是机器人公司顺便搞了点AI,是AI公司为了让模型有地方跑,才去造了机器人。现场他给了一组数字:大小脑AI研发占智元超过3/4的研发人力,研发费用的占比更高。判断三:具身智能先“具身”再“智能”——别在第一曲线里卷。这可能是对中国产业链最清醒的一句提醒。邓泰华承认,第一曲线本体突破,靠的是中国供应链优势,过去三年国内公司跑得快,底子就在这里。但他紧跟着说了一句:“如果仅仅满足于第一曲线,就会逐步进入低层次内卷。应该主动跳出舒适区,进入更高维发展空间。”判断四:两个数据飞轮一旦转起来,后面是加速度邓泰华画了两个飞轮:开发态飞轮(本体→数据→模型→部署)部署态飞轮(真实场景数据持续反哺模型)。他说现在行业主要靠第一个在跑,但当部署数量越来越多、场景越来越丰富,第二个飞轮会自己转起来。这跟特斯拉的影子模式一个思路:车在路上跑,数据自动回传,模型自动迭代,越跑越聪明。机器人也一样,部署量一上来,数据飞轮就是天然壁垒。哪个厂家先跑通,后面追起来就很难了。判断五:机器人和人对话的那条线,会被逐渐抹平。
现在机器人说话,大多是语音转文字、处理完再转回语音,每转一次,语气情绪就丢一层。行业正在往端到端的方向走,直接用语气、表情、停顿这些原生信号来训练。
这意味着以后你对面的机器人,不再像Siri,更像一个能听出你不耐烦的真人。再往前走,就是“物理世界图灵测试”——那将会是具身智能真正的“ChatGPT时刻”。写在最后结合上面这五个判断,回头再看那张XYZ曲线图,会发现一件有意思的事:把XYZ三条曲线中译中过来,其实他是在表达:1、 别在第一阶段待太久。能动起来不算什么,会干活才有价值;2、 会干活还不够,得自己越干越聪明。3、 上面那五个判断,其实都在给这三步铺路,哪一年算是节点、靠什么跨过去、跨不过去会卷成什么样。所以这更像是一场沙盘推演。能动的机器人是新闻,会干的机器人才是未来。第一曲线再热闹,撑不起一个万亿级赛道。
而什么时候它连说话都让你忘了对面是台机器,具身智能才真正走进了每个人的生活。


