DC娱乐网

一篇研究Agent如何检索的论文 Is Grep All You Need?《靠

一篇研究Agent如何检索的论文 Is Grep All You Need?《靠 Grep 就够了吗?Agent Harness 如何重塑 Agentic Search》地址:arxiv.org/pdf/2605.15184

本文研究在 LLM agent 做检索增强任务时,简单的 grep/lexical search 和常见的 vector search 到底谁更有效,以及这个结果会不会受到 agent harness、tool calling 方式和上下文噪声的影响。

结论是:在 LongMemEval 长对话记忆任务中,grep 在多数实验里比 vector retrieval 更准确,尤其是 inline 工具结果直接进入上下文时,grep 在所有 harness-model 组合中都超过 vector;但作者也明确限制了这个结论的适用范围,因为该任务大量依赖日期、偏好、计数、用户事实等可在原文中直接命中的证据,换到更依赖语义改写、跨文档综合或代码语义的场景,vector 或 hybrid retrieval 可能表现不同。更重要的发现是,同一份语料在 Chronos、Claude Code、Codex CLI、Gemini CLI 等不同 agent 环境下会得到明显不同的结果,file-based 工具结果也可能改变 grep 与 vector 的胜负关系;因此,agentic search 应该把 retrieval mechanics、harness orchestration 和 delivery path 作为一个整体来评估。

AI创造营 How I AI