DC娱乐网

微软推出Fara1.5 AI智能体模型任务成功率达72%,超越OpenAI Op

微软推出Fara1.5 AI智能体模型任务成功率达72%,超越OpenAI Operator

微软研究院近日发布了最新的Fara 1.5 AI智能体模型,这是一个适用于浏览器场景下的AI智能体模型,模型有4B、9B和27B三个参数规模版本。微软称该智能体可以在浏览器中完成各种复杂任务,在Online-Mind2Web测试中,Fara 1.5-27B模型能够获得72%的任务成功率,超越了OpenAI Operator,进一步缩小了与Yutori n1等闭源商用模型的差距。

微软在公告中指出,相比起前代的Fara-7B,Fara 1.5有着更高的任务成功率,在涵盖136 个主流网站、共计 300 项任务的Online-Mind2Web测试中,Fara 1.5-9B的任务成功率达到63%,几乎是Fara-7B的两倍,同时也大幅超越同规格的GUI-Owl-1.5-8B(49%),后者是目前同参数规模下表现最好的智能体模型。而Fara1.5-27B的任务成功率更是高达72%,比OpenAI Operator高出13.7%,进一步缩小了与Yutori n1等闭源商用模型的差距。同时新智能体针对真实交互场景进行了深度优化,可胜任表单填写、跨平台比价等日常实用任务,并能贴合用户偏好,使交互过程更加流畅;另外新智能体还能突破权限访问限制,帮助用户完成发送邮件、订机票等实操任务,而非停留在信息检索层面。

具体原理上,Fara 1.5采用 Qwen3.5为基础模型,遵循“观察-思考-行动”循环,在循环的每一步都会接受历史对话和浏览器中最近3张截图,然后预测下一步的行动。智能体采用约200万条样本做Fine-tuning(微调),其中 60%来自网页轨迹,12.8%来自合成环境,12.5%来自表单填写与用户交互,8.8% 来自事实锚定(Grounding),4.9%来自视觉问答。安全性方面,当智能体在遇到缺少个人信息、任务描述含糊和即将执行未批准的不可逆行为(如提交表单)的情况时,会主动暂停并询问用户。