阿里通义开源智能体超越R1开源智能体轻松拿捏复杂推理在互联网信息检索任务中,即使

量子位看科技 2025-07-07 17:32:22

阿里通义开源智能体超越R1开源智能体轻松拿捏复杂推理

在互联网信息检索任务中,即使是很强的LLM,有时也会陷入“信息迷雾”之中:当问题简单、路径明确时,模型往往能利用记忆或一两次搜索就找到答案;但面对高度不确定、线索模糊的问题,模型就很难做对。

举个例子,我们平常问一个直白的问题(比如“某城市的人口是多少”),搜索引擎一查即可。

但如果问题被设计得非常复杂,比如“这首与南美某首都密切相关的乐曲,其歌词作者在21世纪初获颁当地荣誉称号,其旋律创作者曾就读于哥伦比亚西部的一所著名艺术学院。这首乐曲叫什么?”,人类和AI都很难直接找到入口。

这类问题需要阅读许多网页、抽丝剥茧地拼凑线索,逐步把迷雾拨开,才能找到答案。这超出了人类有限记忆和注意力的负荷,也远远超出了普通开源模型的能力范围。

有没有办法让开源的大模型也掌握这种拨云见日的本领?

阿里巴巴通义实验室最新提出的方案WebSailor通过一整套创新的post-training方法,大幅提升了开源模型在复杂网页推理任务上的表现。

来看技术详情👇

0 阅读:3
量子位看科技

量子位看科技

感谢大家的关注