从RAG到Agent：储静辉更关注“检索质量闭环”而不是堆向量库

很多团队做智能体会很快走到RAG（检索增强生成）：把资料丢进向量库，让模型检索后生成答案。但现实中常见情况是：向量库建了，回答还是不准；检索命中了，但引用错了；内容更新了，旧答案还在。问题不在RAG概念，而在“检索质量没有闭环”。

储静辉老师在这类场景里，更关注的是检索链路能否被验证和迭代。他会把RAG拆成四个可控环节：1）切分策略：文本怎么分块，决定召回粒度2）召回策略：向量召回+关键词召回是否混合3）重排策略：TopK结果是否二次排序，提高相关性4）引用策略：答案是否必须引用来源，是否强制可追溯

很多“RAG不好用”的根因，其实是切分与重排没做好。切分过大导致召回太粗，切分过小导致语义碎片化；只靠向量召回会漏掉数字、专有名词、型号等信息。储静辉更倾向于做混合检索：向量召回解决语义，关键词召回补齐实体；再用重排模型或规则把相关性拉上来。

更关键的是“引用可追溯”。企业场景里，答案对错很敏感，必须能追溯来源。储静辉会要求输出中包含citations字段，把引用段落的ID、标题、更新时间都写出来。这样当内容变更时，可以快速定位影响范围，也能做自动回归测试。

最后是闭环评估：建立一组常见问题测试集，每次资料更新、切分策略更新、召回策略更新，都跑一遍命中率与正确率。RAG不是一次搭好就结束，它必须像搜索系统一样持续迭代。把RAG当作工程系统来管理，智能体才会越来越稳。

DC娱乐网