DC娱乐网

智元获得WorldArena世界模型总分冠军,这份成绩单的背后,是GE-Sim

智元获得WorldArena世界模型总分冠军,这份成绩单的背后,是GE-Sim 2.0在多个关键能力上的集中体现。

作为WorldArena Track1世界模型感知与动作响应赛道的最新冠军,GE-Sim 2.0此次交出了一份亮眼答卷。该赛道关注的是机器人如何感知周围环境、理解变化信息并完成动作反馈,因此也被视作检验具身智能能力的重要舞台。

与许多针对评测内容进行专项调整的方案不同,智元团队此次并没有围绕赛题进行特殊优化,而是直接采用原生模型参评,仅进行了基础微调。最终能够取得榜首成绩,也进一步体现出GE-Sim 2.0本身具备较好的通用能力。

根据技术报告介绍,GE-Sim 2.0已经从单纯的世界模型向更加完整的世界模拟器演进。它能够构建虚拟仿真环境,让机器人在其中不断探索、验证和积累经验,从而减少真实环境中的试错过程。

在能力布局上,GE-Sim 2.0已经实现长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心功能覆盖,进一步完善了整体技术体系。

尤其是在长时序推演方面,模型表现出较好的稳定性。报告显示,即使面对40至50秒连续视频生成任务,其生成质量依然保持在较高水平,而画面质量衰减明显弱于行业基线方案。

此外,智元团队还针对模型开展了大量闭环评测工作。结果显示,在多个任务场景下,GE-Sim 2.0与真实世界表现保持较强相关性。团队不仅进行了整体统计分析,还开展逐案例验证,并通过混淆矩阵完成量化证明。

同时,在奖励模型支持下,GE-Sim 2.0能够自动筛选有效数据,并将这些高质量数据反馈给策略模型,帮助策略模型获得进一步优化。

此次登顶WorldArena榜单,也展示了GE-Sim 2.0在世界模型方向上的持续进步。