DC娱乐网

舞肌灵巧手炒菜,它石智航绣花:2026,具身智能“细嗅蔷薇”

作者|青苹吹果编辑|无心插柳柳橙汁起猛了,看到机器人做饭了!最近,法国的Genesis AI在官网放出了一段demo,让

作者|青苹吹果

编辑|无心插柳柳橙汁

起猛了,看到机器人做饭了!

最近,法国的Genesis AI在官网放出了一段demo,让机器人做了一盘西红柿炒鸡蛋,全程无需人工干预,做起来还有模有样。

像什么用刀铲起切好的西红柿放到锅里、用手指捻起白盐撒进去等等操作,一套连招行云流水。

而且,它还会单手打鸡蛋!简直是具身智能在厨房界最严厉的母亲。

我都不会,我只会单手捏碎鸡蛋......

整个视频看完后我一整个大震惊,还有些兴奋。

毕竟谁不想下班回家,就能急头白脸地吃上一顿机器人做好的香喷喷饭菜呢?

上次让我叹为观止的,还是去年年底,它石智航的A1机器人穿针引线,完成手工刺绣。

再加上现在看到的这个正在炒西红柿鸡蛋的Genesis机器人,我突然意识到——

2026年,机器人可能真的上得厅堂,下得厨房,能文能武,持证上岗了!

往上游挖,我还挖出了Genesis的幕后供货商舞肌科技,了解了一下他们做这双灵巧手的逻辑。

他们的逻辑很有前瞻性,不只是把手做成精密工具,而是让机器人从人类操作里学,毕竟,于机器人来说,真正进入真实世界后,很多任务不是“看懂了”就能完成,而是要靠手去抓、捏、拧、拿、放,完成大量接触式操作。

而且,我还顺便挖出了一个劲爆消息,他们的舞肌二代手要来了。

不是,一代的震撼还没消化完,你二代就要来了?

只能说,时代变了,过去大家讲具身智能,更多关注大模型、VLA、世界模型,也就是机器人的“大脑”,但如今,机器人要真正干活,需要一只足够灵活、稳定、接近人类操作方式的手。

一组demo的“魔法轰炸”

回顾过去几年,机器人赛道的“炫技”早已让人审美疲劳。

无论是机械舞、后空翻还是演小品,热闹过后往往归于沉寂。

原因很简单,这些技能大多只能远观,并不能给咱们的日常生活带来什么变化。

普通人更期待的是机器人能踏实地帮我打扫卫生、料理家务。

然而,家务活恰恰是机器人面临的“地狱级”难题。

5月初,Genesis AI亮出了首个机器人基础模型系统GENE-26.5。

除了炒菜,视频中还展示了实验室移液。

手法也十分专业。

调配冰沙。

它还知道卡在一起的塑料杯可以只取一个,我哭死。

拆解魔方。

不开玩笑,机器人解得比我快。

收纳琐碎物件。

一只手同时用多个手指夹起不同的小物件,再放入不同的收纳位置,这对指间力道的拿捏有点东西啊!

缠胶布线。

拿起胶带那一刻的手势好像在说:小小胶带,拿捏~

除此之外,它还会弹奏钢琴。

这几个demo,都值得细品。

首先是速度。

官方明确表示原图直出,没有通过加速、剪辑,也就是说机器人是在真实节奏下工作,而不是在“表演”。

其次是活人感。

比如切完番茄后转移食材这个环节,机器人没有简单把刀当铲子用,而是用刀背和砧板形成支撑,再通过双手协同把番茄拨出去。

再比如,单手同时抓四个不同尺寸的物体,直接夹在指缝里,一次性抓取,这个操作没有人设定程序,而是机器人自己“拿捏”分寸。

这些个手法太“人”了,我就经常这么干。

但机器人做到这一点,意味着手指开始具备「分工」的能力。

上一次这么惊艳,还是看它石智能的机器人绣花。

当时,TA的机械臂“小手”捏着一根绣花针,稳准狠地刺穿绣布,另一只手瞬间接住针尖,接着以刚刚好的力道拉紧丝线,甚至在空中完成绣针的“换手”传递,整个过程行云流水。

好家伙,这手比我都稳,真是“绣”外慧中。

毕竟,绣花代表着机器人的“顶级段位”。绣一个完整的字是上百步的长程任务,机器人必须“脑子好”,提前规划好所有步骤、不翻车,其次,针细布软,要求手法极其细腻。力度轻了图案松垮,重了画布会破,全靠高精度柔性力控。

在今年3月的AWE展会上,它石的A1机器人在60分钟连续作业中重复完成柔性线束插拔装配任务达105次,打破“机器人一小时内装配亚毫米级线束最多次数”的吉尼斯世界纪录,这也是中国具身智能企业在工业精密操作领域的首个吉尼斯称号。

这让我感慨,它石的底牌逻辑与Genesis AI异曲同工,它们都跳出了表演型Demo的套路,直奔“干活”这一命题而去。

那么,国内外这些让机器人“心有猛虎,细嗅蔷薇”的厂商,背后有哪些技术大招?

手和大脑

缺一不可

它石智航的技术我系统性了解过,首先是能“开天眼”的全视角通感决策(OSD),让机器人摆脱对固定视角的依赖,即使面对训练中从未见过的新角度,也能通过理解环境状态灵活应变。

你想想看,现在市面上绝大多数机器人,包括那些看起来很厉害的,他们的视觉系统本质上是「绑定」的。摄像头装在哪个角度,它就只能从那个角度去理解世界。你换个角度放,或者场景中出现了训练时没见过的新视角,它的成功率就会啪的一下掉下去。

就好像一个背诵了标准答案的学生,题目换种问法就不会了。

它石智航的OSD解决的问题就是这个。

它让机器人能够真正理解「环境状态」,而不是死记硬背「某个角度长什么样」。

于是乎,其能在未见新视角的任务成功率提升3倍。

其次是赋予机器人“指尖触觉”的高密度触觉感知(HTS)。

触觉这件事,人类自己其实都还没完全搞清楚。你的指尖能感知到0.01毫米的纹理差异,能在闭着眼睛的情况下分辨出丝绸和棉布,能在0.1秒内判断一个东西该用多大的力去抓。

这种「毫米级精细响应」,对于机器人来说,过去基本是不可能完成的任务。

它石是怎么做的呢?

它们搞了超百万小时的WIYH数据集,有这个量级的数据打底,机器人才终于能「感觉」到那些非常细微的东西,从而能完成毫米级精细响应,操控线束、布料等柔性物体。

最后,是让机器人“稳如磐石”的隐空间丝滑动作(LAS),将抖动降低超过45%,确保了长时间、高精度作业的稳定性,一举治好了机器人的帕金森。

无独有偶,我仔细看了遍GENE-26.5的演示,发现最抓人眼球的不只是模型本身,而是那双灵巧手,和人手几乎一模一样大小。

具身智能领域有著名的「莫拉维克悖论」,大概意思是对人类来说很难的逻辑推理,对AI来说很容易;但对人类运动易如反掌的个感知(比如抓杯子),对AI却难如登天。

Genesis AI团队在技术博客里说:灵巧操作不是一个纯粹的模型训练问题,而是一个从上到下的系统问题。

硬件、控制、数据、模型、评估,任何一层的短板都会传导到整条链上。

所以他们的选择是每一层都自研。

那只名为 Genesis Hand 1.0的机器手,被设计成和人手1:1的尺寸比例,手掌和手指覆盖着软性材料,模拟人类皮肤的接触力学。

这样做不是单纯为了好看,而是为了绕开一个老问题。

过去机器人手长得和人区别太大,人类操作数据在映射到机器人关节时,必须经过复杂的重定向算法,信息会在过程中不断丢失。

Genesis AI的解法极其硬核,既然要学人干活,那就先造一只“人手”。

Genesis Hand 1.0覆盖了仿生皮肤材料,模拟了反馈。

因为手的大小比例和人一模一样,人类的操作数据可以直接灌入,“具身差距”几乎消失。

为了配合这只手,团队还重写了整套控制栈。他们把机械臂供应商的原厂控制器换掉,自研中间件跑在实时内核上,EtherCAT通信频率500Hz,端到端的延迟最低压到了3毫秒。

原厂控制器画一个十五厘米的圆形,轨迹追踪误差能到两厘米,换上去之后直接降到了两毫米。

这种量级的提升对普通人来说也许无感,但在真实操作里,延迟和误差但凡多一点点,效果可能就会天差地别,尤其是对于一些精细操作而言。

换句话说,想做出干得了细活的机器人,得先造出允许它干细活的手和身体。

好,现在手和身体有了,那么“脑子”上哪儿领?

大语言模型可以在互联网的海量文本里自己“读”出智能,但机器人不行。

它需要的不是文字,而是人类在物理世界里的真实操作。

这些数据极度昂贵。

用遥操作设备让机器人一帧帧地学,成本高,速度慢,而且数据本身就烙着那一款机器人的硬件痕迹,换一个型号可能就不好使了。

所以Genesis AI 换了一种思路:回归人类本身。

他们做了一只专门配套的数据采集手套,内部通过电磁场追踪手指动作,手部布满高密度触觉传感器。

尺寸和他们的机器手一模一样,工人戴上之后该干什么干什么,手上的每个动作、力量变化和接触细节都会被高保真地记录下来,直接迁移到机器人身上,不需要重映射。

这套方案的硬件成本据称只有传统遥操作方案的百分之一,采集效率却高出五倍。

据悉,Genesis AI和合作伙伴已经收集了超过20万小时的多模态数据。

除了手套数据,还纳入了第一视角视频和第三视角互联网视频,三层数据在质量和规模上构成一个覆盖广泛的分布。

Genesis AI

独有的「物理基因」

能想出如此另辟蹊径的技术路线,得益于Genesis AI有一个很特殊的起点。

它不是从机器人本体或者大模型开始做起的,而是来源于一个开源物理引擎Genesis平台。

这个平台可以模拟刚体、液体、气体、可变形物体、薄壳、颗粒材料等多种物理现象。

早在2023年,核心团队就提出过一个方向:用生成式仿真自动生成任务、场景和训练监督,规模化训练机器人技能。

这个思路后来成为Genesis AI很重要的竞争力。

在GENE-26.5的体系里,仿真并不只是用来生成训练数据,更多承担的是闭环评估和迭代加速器的作用。

相当于在一个几乎无限环境中,不停测量模型到底跌倒在哪些环节、哪个动作还不够像人。

传统真机验证太慢、太贵、太难复现,但如果能用仿真把测试周期从几周压缩到几小时,模型的迭代速度就会快一个数量级。

公司创始人兼CEO周衔是CMU机器人博士,也是生成式仿真这条路线的重要发起人。

联合创始人Théophile Gervet则来自Mistral AI。

团队中有参与过强化学习无人机研究的科学家,也有Diffusion Policy的核心作者。

这种复合背景让Genesis AI从一开始就对“全栈”有清晰的认识。

机器人能力不是模型单点突破,而是数据、硬件、仿真、控制、评测的系统协同。

目前,Genesis AI已经与法国、德国、意大利的潜在客户展开深入谈判,目标行业包括汽车、电子、制药、物流。

公司成立于2025年初,已完成1.05亿美元初始融资,投资方包括前Google CEO Eric Schmidt等。目前,Genesis AI是法国规模最大的种子轮之一。

写在最后

回过头看今年上半年这波操作Demo的密集发布,你会发现一个最根本的变化。

比起三年前的“机器狗翻跟头”,今年各团队都纷纷将目光放在了“手”上。

Genesis AI放出的一系列demo,全是在展现机器人的指上功夫。

如今,更大的行业共识正在形成。

要想让人形机器人真正走进工厂、医院、家庭,它需要的远不止一个会算题的大脑,还有一双足够灵活、足够精密、足够安全的手。

中商产业研究院预测,2026年中国具身智能市场规模可能达到10904亿元。在这些数字背后,资本下注的已经不再是“机器人会不会走路”,而是“机器人能不能上岗”。

它石智航首席科学家丁文超在吉尼斯认证当场说了一句很硬气的话,很适合作为今天的结尾。

他说:“具身智能的价值,不在于能表演什么,而在于能创造什么。”

这个答案,将会是拉开具身智能产业真正序幕的第一把钥匙。