DC娱乐网

2026,会是“具身智能”的拐点时刻吗?

2025年中国将“具身智能”首次列入国家未来产业重点培育清单,随后资本加速入局,机器人领域的产品创新更是多点开花。从双足

2025年中国将“具身智能”首次列入国家未来产业重点培育清单,随后资本加速入局,机器人领域的产品创新更是多点开花。

从双足人形机器人的动态突破到无人驾驶、无人机集群的场景落地,具身智能正加速完成从实验室到产业化的跨越。

而这场被英伟达创始人黄仁勋断言为 “人工智能下一个前沿” 的浪潮,2026年是否会迎来发展走向的关键拐点?近期,中国信息通信研究院与清华大学联合发布的《具身智能发展报告(2025年)》为深度洞察行业发展提供了参考方向。

产业拐点:技术驱动型向价值驱动型转变

当下,具身智能产业正处于从“技术验证期”迈向“价值兑现期”的关键转折点。

报告指出,截至2025年12月,我国具身智能和机器人领域投资事件达744起,融资总额735.43亿元人民币。这些字背后,折射出资本从追逐概念转向重视商业落地的理性回归。

值得关注的是投资结构的微妙变化。早期天使轮和种子轮融资占比从2024年的35%下降至2025年的28%,而成长期和战略投资比例则从45%上升至52%。这一变化表明,**资本市场更加青睐那些已初步验证商业模式、具备场景落地能力的企业**。

产业界对技术评价标准也在发生根本性转变。在具身智能发展初期,“运动自由度数量”“最大负载能力”“航时间”等硬性指标是衡量机器人性能的主要标准。

而如今,行业更关注“任务成功率”“平均无故障时间”和“单次任务能耗成本”等与实际应用紧密相关的指标。

以物流场景为例,业内头部企业不再仅展示机器人的奔跑速度或跳跃高度,而是重点演示其在模拟仓库环境中连续工作8小时的分拣准确率和效率。这种从“炫技”到“实干”的转变,标志着产业进入了更加务实的发展阶段。

与此同时,地方政府对具身智能产业的支持方式也在悄然改变。从早期直接的财政补贴和税收优惠,转向提供应用场景开放、测试场地共享和数据资源对接等更具针对性的支持。北京、上海、深圳等城市纷纷建设机器人训练场,为企业提供真实的测试环境,加速技术迭代。

路径之争:通用梦想与专用现实的技术选择

具身智能领域最核心的争议之一,是走通用路线还是专用路线。这场争论不仅关乎技术方向,更影响着数万亿资本的流向和整个产业生态的构建。

通用派主张,具身智能的终极目标是构建能够适应多样化环境、完成多种任务的通用智能体。特斯拉的Optimus、Figure AI的Figure系列以及波士顿动力的Atlas都代表了这一技术路线。

它们的核心逻辑是:只有构建通用平台,才能实现规模效应,最终降低成本。

然而,通用路径面临着“冷启动”难题:如何让一个通用系统在特定场景中达到甚至超过专用系统的性能?数据飞轮的启动需要时间,而在商业世界里,时间是最昂贵的成本。

以人形机器人为例,要实现真正通用,需要解决从动态平衡、精细操作到场景理解等一系列复杂问题,这些问题的耦合使得技术突破异常艰难。

相比之下,专用派选择了一条更加务实的道路。这一路径的代表包括专注物流场景的Agility Robotics的Digit机器人、主攻工业制造的优傲机器人协作机械臂,以及深耕电力巡检的四足机器人企业云深处。

专用派的逻辑是:在技术成熟度不足的现阶段,针对特定场景优化是更高效、更可行的商业选择。

宇树科技将四足机器人价格降至消费级水平,正是通过简化设计、专注核心功能实现的。这种“减法思维”在商业上取得了显著成效——2025年,该公司消费级机器人销量同比增长超过300%。

两种路径并非完全对立,而是呈现相互借鉴、融合发展的趋势。通用派企业开始针对特定应用场景推出定制化版本,而专用派企业则在产品设计中预留接口,为未来功能扩展提供可能。

这种融合趋势在技术架构上表现得尤为明显。早期具身智能系统多采用模块化设计,感知、规划、控制等模块相对独立。

而最新趋势是构建端到端的一体化系统,通过深度学习直接建立从传感器输入到动作输出的映射关系。这种架构减少了模块间的信息损失和误差累积,但也对数据质量和算法能力提出了更高要求。

2025年,具身智能技术路线出现了一个值得关注的折中方案——基于通用平台的专用应用。

这一方案试图在通用性和专用性之间找到平衡点,通过构建通用的硬件平台和软件架构,针对不同应用场景开发专用算法和应用模块。

这种“平台+应用”的模式在自动驾驶领域已有成功先例,正在向机器人领域扩展。

具身智能进化的数据瓶颈与破局探索

高质量数据是具身智能发展的核心驱动力,但目前行业正面临着严重的“燃料危机”。这不仅仅是数量不足的问题,更是**质量、多样性和获取成本的多重挑战。

具身智能的训练数据需要物理交互而非简单的图像标注,这使得数据采集成本远高于传统AI。一项行业调研显示,为训练一个简单的抓取任务策略,平均需要约5000次真实机器人尝试,成本高达2-3万美元。这解释了为什么许多初创公司将大部分资金用于数据采集而非算法研发。

数据稀缺问题在不同任务类型上表现各异。对于导航和移动任务,仿真环境能够提供相对逼真的训练数据;但对于涉及接触和操作的精细任务,如装配、包装等,仿真与现实之间的“现实鸿沟”依然显著。这是因为物理引擎难以精确模拟摩擦、变形和材料特性等复杂物理现象。

面对这一挑战,行业正在探索多元化的数据获取路径:

遥操作技术成为高质量示范数据的主要来源。通过专家远程操控机器人完成任务,可以获得精确的动作序列和状态数据。2025年,国内多家企业推出了新一代遥操作系统,如星尘智能的Astrobot Suite平台,将数据采集效率提升了约40%。

合成数据生成技术取得了显著进展。通过物理仿真引擎结合生成式AI技术,可以大规模生成带标注的训练数据。英伟达的Isaac Sim平台集成了最新物理引擎和渲染技术,能够生成接近真实场景的视觉和物理数据。银河通用基于这一平台构建的数据管线,一周内可生成十亿级机器人操作数据。

课程学习与分层训练策略正在被广泛采用。这种策略的核心思想是“从易到难”,先让机器人在简化环境中掌握基本技能,再逐步增加环境复杂性。例如,先训练机器人在无干扰环境中抓取固定位置的物体,再逐步引入位置变化、遮挡和干扰物,最终实现在真实场景中的鲁棒操作。

一个创新的解决方案是构建具身智能数据生态。类似于自动驾驶领域的Waymo Open Dataset,机器人领域也出现了开源数据集,如RoboNet和BridgeData。

这些数据集汇集了来自不同机器人平台的多模态数据,为算法研究提供了宝贵资源。然而,由于机器人硬件和任务的多样性,构建统一、大规模的数据集依然面临挑战。

世界模型的兴起为数据问题提供了新思路。通过学习环境的动态模型,机器人可以在行动前进行“心理模拟”,减少真实试错的成本。

2025年,谷歌的Genie和清华大学的Ctrl-World等世界模型展示了在机器人规划中的应用潜力。通过预测不同行动的可能结果,机器人可以更高效地探索策略空间,降低对大量真实数据的需求。

数据问题的根本解决可能需要等到大规模部署后的数据回流——当成千上万的机器人在真实场景中工作,它们产生的数据将反哺模型,形成正向循环。

这正是特斯拉在自动驾驶领域采取的策略,而具身智能领域的领先企业也在布局类似的数据闭环。

从模块堆叠到认知统一的技术融合

当前,具身智能的技术架构正在经历一场深刻的变革:从“模块化堆叠”转向“端到端一体化”,这一转变不仅体现在软件算法上,也贯穿于硬件设计和系统集成中。

传统的机器人系统采用严格的分层架构:感知模块处理传感器数据,理解环境状态;规划模块基于环境状态和任务目标制定行动序列;控制模块将抽象的动作指令转化为具体的电机控制信号。

这种“感知-规划-行动”的三段式架构便于系统调试和模块化开发,但各模块间的信息损失和误差累积严重限制了整体性能。

新兴的视觉-语言-动作模型试图将这三个环节统一到一个端到端的学习框架中。模型直接接收原始视觉输入和自然语言指令,输出低层控制信号,无需中间表示和手工设计的特征。

Figure AI的Helix模型是这一方向的典型代表,能够实现7-9Hz的认知推理和200Hz的本体控制协同,展示了端到端架构在响应速度和任务性能上的优势。

世界模型为具身智能带来了新的可能性。与传统的环境模型不同,世界模型不仅建模环境的静态属性,还学习其动态演变规律。

通过预测不同行动可能导致的未来状态,机器人能够进行“前瞻性思考”,在行动前评估各种策略的后果。这种能力对于长序列任务规划尤为重要,如“打开冰箱-取出饮料-关上冰箱-走到餐桌-放下饮料”这样的多步骤任务。

技术的融合不仅发生在算法层面,也体现在硬件设计中。新一代机器人关节正朝着高度集成的方向发展,将电机、减速器、控制器和传感器集成在紧凑的空间内。

宇树科技的一体化关节模组将体积缩小至传统方案的1/3,同时散热效率提升50%,实现了爆发力、灵活性和稳定性的平衡。这种深度集成不仅提高了性能,还简化了系统设计和维护。

在感知系统方面,多模态融合成为主流趋势。单一的视觉传感器已无法满足复杂任务需求,行业正积极探索视觉、触觉、力觉和听觉的深度融合。

分层协作架构代表了另一种技术融合思路。与完全的端到端架构不同,分层架构保留了一定的模块化特性,但通过更紧密的耦合和更高效的信息流动提高系统性能。

这些技术融合趋势的共同特点是:打破传统模块边界,实现跨层次的信息流动和更紧密的系统集成。这种融合不仅提升了性能,也降低了系统复杂度和开发门槛。

场景的选择或决定具身智能商业化成败

具身智能的商业化并非技术的单向延伸,而是技术与场景的双向匹配过程。正确的场景选择往往比技术先进性更重要,而这一选择过程正变得越来越理性和精细化。

结构化程度高、任务边界清晰的场景仍然是商业化落地的首选。制造业的装配、检测和搬运任务,物流仓储的分拣、包装和配送,电力系统的巡检和维护——这些场景环境相对可控,任务定义明确,技术要求相对聚焦。

经济价值明确、替代成本高的场景同样具有较强吸引力。危险环境作业、高精度制造、24小时不间断服务等领域,人类劳动力成本高昂或存在安全风险,为机器人提供了明确的商业价值主张。

一个常被忽视的因素是用户的接受度和使用习惯。比如在医疗康复领域,外骨骼机器人需要与患者身体密切接触,舒适性和易用性往往比技术参数更重要。好的产品不仅是功能的堆砌,更是体验的精心设计。这解释了为什么外骨骼机器人在商业化过程中格外重视人机交互设计和适应性调整算法。

目前,具身智能企业正在从 产品提供商” 向 “解决方案供应商” 转型。意味着不仅要交付硬件和软件,还需要深入理解行业流程,提供包括部署、培训、维护在内的完整服务。

比如智元机器人与富临精工的合作,不仅提供机器人本体,还根据产线需求定制软件系统,优化作业流程;这种 “深度绑定” 的模式,或许会成为商业化落地的主流。

结语

回望过去一年,具身智能实现了从技术验证到价值兑现的关键跨越——资本趋于理性、技术走向融合、场景精准落地,为产业的长远发展夯实了根基。

黄仁勋所称的“人工智能下一个前沿”,在2026年或许不会迎来颠覆性的突变,但必将踏入高质量发展的新拐点。

当机器真正拥有理解物理世界、并与环境自主交互的能力,当技术与场景实现更深层次的契合,人类与机器智能共生的时代,正悄然临近。

注:文中部分内容信息源自中国信息通信研究院与清华大学联合发布的《具身智能发展报告(2025年)》。