观点网讯:1月6日,智元具身研究中心发布SOP(ScalableOnlinePost-training)框架,首次将在线学习、分布式架构与多任务通才性引入物理世界VLA后训练,实现机器人集群在真实环境中分钟级模型同步更新。
根据公开资料整理,SOP采用Actor-Learner异步架构,多机器人并行采集数据并上传云端,动态调整在线/离线数据比例,3小时内使商超场景综合性能提升33%,灵巧操作任务成功率普遍升至94%以上,其中纸盒装配达98%。实验显示,四机集群训练速度为单机2.4倍,有效避免过拟合,36小时连续作业验证系统鲁棒性。