阿里通义开源智能体超越R1开源智能体轻松拿捏复杂推理在互联网信息检索任务中，即使

量子位看科技 2025-07-07 17:32:22

阿里通义开源智能体超越R1开源智能体轻松拿捏复杂推理

在互联网信息检索任务中，即使是很强的LLM，有时也会陷入“信息迷雾”之中：当问题简单、路径明确时，模型往往能利用记忆或一两次搜索就找到答案；但面对高度不确定、线索模糊的问题，模型就很难做对。

举个例子，我们平常问一个直白的问题（比如“某城市的人口是多少”），搜索引擎一查即可。

但如果问题被设计得非常复杂，比如“这首与南美某首都密切相关的乐曲，其歌词作者在21世纪初获颁当地荣誉称号，其旋律创作者曾就读于哥伦比亚西部的一所著名艺术学院。这首乐曲叫什么？”，人类和AI都很难直接找到入口。

这类问题需要阅读许多网页、抽丝剥茧地拼凑线索，逐步把迷雾拨开，才能找到答案。这超出了人类有限记忆和注意力的负荷，也远远超出了普通开源模型的能力范围。

有没有办法让开源的大模型也掌握这种拨云见日的本领？

阿里巴巴通义实验室最新提出的方案WebSailor通过一整套创新的post-training方法，大幅提升了开源模型在复杂网页推理任务上的表现。

来看技术详情👇

0 阅读：9

量子位看科技

感谢大家的关注

作者最新文章

1

微软官方Copilot教程零基础学用Copilot编程微软把饭喂到嘴边，教你如何

2

华为破解大模型数学瓶颈华为全新高阶推理框架大模型越来越大，通用能力越来越强，但一

3

AI100产品榜单开启报名量子位智库2025年，国内的AI产品的真用户价值持久战

4

周伯文等交大论AI交大高金MBA课程全新升级AI重构商业逻辑、重塑产业格局，我们

5

DeepSeekR2要来了吗神秘模型疑似DeepSeekR2DeepSeek-R

6

谢赛宁团队3D图像编辑新框架不用提示词精准控制3D画面曾几何时，用文字生成图像已

7

婴儿什么时候有意识婴儿出生时有意识吗婴儿从什么时候开始拥有“意识”？这是科学家

8

OpenAI近两年大事回顾ChatGPT进化史OpenAI自2022年底推出Ch

9

Grok4遭提前曝光马斯克要重写人类知识库马斯克旗下xAI的重磅炸弹Grok 4

10

微软再裁员9100人微软开启第三轮裁员微软又裁员了，这次是9100人。这已是微软

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

格力把高管送去火焰山猴哥都抹汗的地方朱总靠空调坚持了下来。😅孙悟空要是有这条

2

罗永浩连怼网友罗永浩怎么了罗永浩连续发微博怼网友，他怎么了

3

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

4

苹果公司第三财季财报太靓丽了，仅仅iPhone16的营业收入就达到了445亿美

5

红米新机Redmi15外观渲染图曝光：后置三摄采用纵向排列的矩形Deco今

6

25年公认最强拍照手机，有你在用的吗。

7

马斯克已确认，三星拿下特斯拉165亿美元的合作，将为特斯拉生产芯片[doge]我

8

三星是不是都沉默了，这次又全面输给了荣耀三星GalaxyZFold7好不

9

荣耀Magic8全系曝光🔥四杯+7500mAh+2亿潜望荣耀Magic8系

10

目前最新的手机处理器排名，不出意外高通骁龙还是占据主流排第一的是骁龙8至尊领先

科技最新文章

1

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满

2

红米K90系列电池容量曝光，标准版7100毫安电池，Pro是7500毫安，因为标

3

小米的芯片困局又来了。英伟达被约谈的消息一出，雷军估计眉头紧锁。小米手机

4

只有华为Mate80RS非凡大师才能打，荣耀Magic8Ultra影像究竟有

5

荣耀最新旗舰荣耀Magic8系列配置预测，为了满足消费者的需求，这次的荣耀Mag

6

补充：华为Pura80Pro日均降价17.78元三星Galaxy

7

GalaxyS26Ultra带来了一些意想不到的升级•更大的主摄

8

今年荣耀的电池都做到8300mAh了，听说明年还能到10000mAh左右。其实不

9

苹果公司第三财季财报太靓丽了，仅仅iPhone16的营业收入就达到了445亿美

10

预1500元以内，这3款手机的性能和续航“最强”，轻松用五年红米Turbo3