#阿里开源复杂信息搜索模型##AI检索复杂信息新突破# 阿里通义开源了WebSailor,它是目前最强的信息检索模型,专门面向“高不确定性”的复杂信息检索任务。 该模型在BrowseComp基准测试全面领跑,这个基准测试由OpenAI于今年4月提出,专测AI在互联网上搜索“难查信息”的能力。 而WebSailor在中英文基准中全部登顶【图1】,超越了DeepSeek-R1和GPT-4o。 技术上,WebSailor训练方式很不一样:【图2】 - - 先用专家轨迹提取干净的因果链路,完成“冷启动训练”; - 再进入**DUPO强化学习**阶段,逐步优化模型的搜索策略和思考链条; - 所有训练都围绕复杂任务展开,哪怕在SimpleQA上表现也很稳定,具备“向下兼容”能力。 阿里通义本次还发布了SailorFog-QA数据集【图3】: - 用真实网页构建“模糊问答图谱”; - 随机游走式采样,提取不常见实体; - 问题经过“信息模糊化”,让模型难以通过关键词匹配作答,必须靠理解和推理。 目前模型已开源(但参数尚未公布),感兴趣的可以先读论文/看代码—— GitHub链接:github.com/Alibaba-NLP/WebAgent 论文地址:arxiv.org/abs/2507.02592
#阿里开源复杂信息搜索模型##AI检索复杂信息新突破# 阿里通义开源了WebSa
量子位
2025-07-08 18:01:51
0
阅读:3