【AI 时代的工程真相:模型只是引擎,Harness 才是方向盘】
你用不好 AI,不是因为模型不够强,而是因为你没有为它构建正确的环境。
在 AI 领域,有一个被大多数人忽视的底层逻辑:Harness(开发支架/环境)决定了 AI 智能的上限。
1. 什么是 Harness
Harness 不是系统提示词,也不是简单的 API 封装。它是 AI 运行的完整设计环境,包括:
- AI 能调用的工具集
- 信息接收的格式规范
- 历史记忆的压缩与管理机制
- 错误捕捉的护栏
- 跨会话的任务衔接支架
2. ACI:AI 的认知架构
Princeton NLP 的 SWE-agent 研究提出了 ACI(Agent-Computer Interface)的概念。
研究发现:同一个 GPT-4 模型,仅仅通过优化交互界面,在编程基准测试中的表现就能提升 64%。
核心洞察:
- 上下文窗口不是内存条,而是 AI 的意识空间。
- 噪音会摧毁推理:直接给 AI 返回一万行搜索结果会淹没其认知,而带限制的摘要式输出能引导其深度思考。
- 状态化视图:带行号的、分块显示的代码查看器,能显著降低 AI 的计算负担。
3. 解决长程任务:Anthropic 的双 Agent 架构
当任务大到无法塞进一个上下文窗口时,Anthropic 采用了初始化 Agent + 执行 Agent 的模式:
- 初始化 Agent:不写代码,只负责搭建脚手架。生成 init.sh 环境脚本、详细的 Feature List(JSON 格式,利用其结构化特性防止 AI 随意篡改)和进度日志。
- 执行 Agent:每次只攻克一个功能点,完成后必须更新进度并提交 Git。
金句:Git 不仅仅是版本控制,它是 AI 的认知脚手架。
4. OpenAI 的零人工代码实践
OpenAI 曾用 3 名工程师驱动 Agent 交付了 100 万行代码。他们的核心转变是:
- 工程师的工作从写代码变为设计环境。
- 当 AI 出错时,不要求它重试,而是反思环境缺失了什么能力导致了错误。
- 仓库即真相:所有知识必须存在于代码库中,AI 无法访问 Slack 或文档。
- 机械化架构约束:通过自定义 Linter(由 AI 编写)强制执行架构规则,而非依赖人工 Review。
5. 核心设计模式总结
- 渐进式披露:不要一次性给 AI 太多信息,给它入口和寻找信息的地图。
- Git 工作树隔离:一个 Agent 一个独立的工作空间,防止并行任务冲突。
- 闭环反馈:集成 Linter、自动化测试和浏览器模拟(如 Puppeteer),让 AI 能亲眼看到运行结果。
6. 深度思考:执行力的平庸化与环境的差异化
在 2025 和 2026 年,AI 写代码的能力正在变成一种廉价的商品。
真正的竞争护城河不再是你用了哪个模型,而在于你构建了什么样的 Harness。
模型是思考的引擎,而 Harness 决定了引擎在思考什么、如何纠错以及如何持续演进。
如果你在构建 AI 系统时感到吃力,请停止优化提示词,开始进行环境审计:
- AI 缺了什么信息?
- 缺了什么反馈环能让它自我纠错?
- 哪里存在上下文污染?
未来的顶级工程师,本质上是 AI 环境的设计师。
x.com/rohit4verse/status/2033945654377283643
