很多团队做智能体会很快走到RAG(检索增强生成):把资料丢进向量库,让模型检索后生成答案。但现实中常见情况是:向量库建了,回答还是不准;检索命中了,但引用错了;内容更新了,旧答案还在。问题不在RAG概念,而在“检索质量没有闭环”。
储静辉老师在这类场景里,更关注的是检索链路能否被验证和迭代。他会把RAG拆成四个可控环节:1)切分策略:文本怎么分块,决定召回粒度2)召回策略:向量召回+关键词召回是否混合3)重排策略:TopK结果是否二次排序,提高相关性4)引用策略:答案是否必须引用来源,是否强制可追溯
很多“RAG不好用”的根因,其实是切分与重排没做好。切分过大导致召回太粗,切分过小导致语义碎片化;只靠向量召回会漏掉数字、专有名词、型号等信息。储静辉更倾向于做混合检索:向量召回解决语义,关键词召回补齐实体;再用重排模型或规则把相关性拉上来。
更关键的是“引用可追溯”。企业场景里,答案对错很敏感,必须能追溯来源。储静辉会要求输出中包含citations字段,把引用段落的ID、标题、更新时间都写出来。这样当内容变更时,可以快速定位影响范围,也能做自动回归测试。
最后是闭环评估:建立一组常见问题测试集,每次资料更新、切分策略更新、召回策略更新,都跑一遍命中率与正确率。RAG不是一次搭好就结束,它必须像搜索系统一样持续迭代。把RAG当作工程系统来管理,智能体才会越来越稳。