【AI 写代码只会敷衍?问题根本不在模型本身】
快速阅读:AI Agent 的天性是走捷径,它们会为了快速完成任务而自动略过测试、规范和评审。要让 AI 从“写代码的初级民工”变成“可靠的工程师”,核心不在于写更长的提示词,而在于为它构建一套强制性的工作流(Workflow)。
目前的 AI 编程助手有个致命的通病:它们太想“完成任务”了。
由于奖励机制只指向“任务已完成”,Agent 会像个急于表现的实习生,写完功能就宣布胜利,却从不关心设计文档、测试覆盖或边界情况。这种行为模式在软件工程里叫“走捷径”,在现实中叫“制造事故”。
要把这种随机性极强的概率模型,驯化成生产级的工具,必须引入“工程脚手架”。
与其给它写几千字的“优秀编程指南”(这种长篇大论通常会被模型视而不见),不如直接给它“技能”(Skills)。这里的技能不是指知识库,而是一套带有退出标准的指令流水线:先写失败的测试,再写代码,最后必须出具验证证据。
这里有个很有意思的设计:反合理化表格(Anti-rationalization tables)。
模型极擅长找借口。当它觉得“这个任务太简单不需要写规范”或者“测试以后再补”时,它会编造出一套听起来极其合理的逻辑来搪塞你。针对这一点,我们需要在工作流里预埋“反驳逻辑”——当它试图跳过步骤时,系统直接甩给它一个预设的驳斥。
这其实是在用管理人类团队的经验,去管理一个非人类的系统。
我们要做的不是试图让模型变得完美,而是承认它的不靠谱,然后通过流程(Process)来对冲这种不靠谱。就像我们能把人类送上月球,靠的不是宇航员从不犯错,而是围绕他们构建了一套极其严密的容错系统。
如果 AI 只是帮你写代码,那它只是个加速器;如果它能学会遵循工程规范,它才真正具备了生产力。
addyosmani.com/blog/agent-skills/
