阶跃星辰开源GUI Agent技术和4B GUI Agent模型

上证报中国证券网讯（记者孙小程）近日，大模型独角兽阶跃星辰开源了跟豆包手机助手同类型的GUIAgent技术——名为GELab-Zero的套组，同时，开源了4B的GUIAgent模型（GELab-Zero-4B-preview）以及完整的配套基建。这款模型在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录，取得SOTA成绩，在海外社区引起了开发者的热议。

阶跃星辰在ScreenSpot、OSWorld、MMBench、AndroidWorld多个开源基准测试上对GELab-Zero-4B-preview模型进行了全面评估，涵盖GUI理解、定位、交互等多个维度。

测试结果显示，GELab-Zero-4B-preview在多项权威开源基准测试中超越其他主流模型，拿下同尺寸SOTA。同时，GELab-Zero-4B-preview的表现还超越了参数量更大的GUI-Owl-32B等模型，性能更优也更易部署。

根据阶跃星辰官方介绍，GELab-Zero提供一键拉起即可获得类似开源GUIAgentMCP的体验，在本地即可完成部署，并将推理链路完全掌控在自己手里。就具体能力而言，GELab-Zero可支持4B量级模型在消费级硬件上运行，兼顾低延迟与隐私。

在官方公布的应用场景示例中，GELab-Zero可以很好地执行复杂任务和模糊指令。譬如能够精准地完成一次跨品类、涉及不同商品规格和数量的采购，也可以在接到经典电影、适合遛娃的地方这类模糊和有主观色彩的需求时，自行判断执行标准并顺利完成任务。

据了解，阶跃星辰研发GELab-Zero的初衷，是解决GUIAgent面临的诸多工程侧难题——由于移动端应用生态极其碎片化，GUIAgent在不同品牌、型号设备上运行时场景会在多设备ADB连接、依赖安装、权限配置、推理服务上线、任务编排与回放等方面出现工程问题，这意味着Agent开发者与MCP用户需要处理诸多工程基建工作，难以将精力集中于策略创新。

行业内人士认为，随着大模型技术的快速演进，Agent任务执行能力将开启手机品牌的下一个赛点，毕竟在基础配置和影像能力上狂卷带来的增长空间已十分有限。但由于大模型终端落地对于算法、算力、训练数据、系统权限等全链条都有较高要求，掌握数据和系统的手机厂商与擅长算法研究的大模型厂商合力研发，共同为用户定义全新的AI手机体验，被认为是更好的落地模式。

公开资料显示，此前，阶跃星辰已经和包括荣耀、OPPO、中兴在内的超60%国产手机厂商达成合作。

DC娱乐网

阶跃星辰开源GUI Agent技术和4B GUI Agent模型

热门分类