#阿里开源复杂信息搜索模型##AI检索复杂信息新突破# 阿里通义开源了WebSa

#阿里开源复杂信息搜索模型##AI检索复杂信息新突破#
阿里通义开源了WebSailor，它是目前最强的信息检索模型，专门面向“高不确定性”的复杂信息检索任务。
该模型在BrowseComp基准测试全面领跑，这个基准测试由OpenAI于今年4月提出，专测AI在互联网上搜索“难查信息”的能力。
而WebSailor在中英文基准中全部登顶【图1】，超越了DeepSeek-R1和GPT-4o。
技术上，WebSailor训练方式很不一样：【图2】
- - 先用专家轨迹提取干净的因果链路，完成“冷启动训练”；
- 再进入**DUPO强化学习**阶段，逐步优化模型的搜索策略和思考链条；
- 所有训练都围绕复杂任务展开，哪怕在SimpleQA上表现也很稳定，具备“向下兼容”能力。
阿里通义本次还发布了SailorFog-QA数据集【图3】：
- 用真实网页构建“模糊问答图谱”；
- 随机游走式采样，提取不常见实体；
- 问题经过“信息模糊化”，让模型难以通过关键词匹配作答，必须靠理解和推理。
目前模型已开源（但参数尚未公布），感兴趣的可以先读论文/看代码——
GitHub链接：github.com/Alibaba-NLP/WebAgent
论文地址：arxiv.org/abs/2507.02592

DC娱乐网

#阿里开源复杂信息搜索模型##AI检索复杂信息新突破# 阿里通义开源了WebSa

热门分类