我不看好Manus,不代表我说Manus垃圾,更不代表Agent没有技术含量
我明确表达过对于Manus期待实现的通用Agi不看好,但另外一种极端的观点,我更反对,就是认为Ai Agent就是“套壳”这种观点。
很多人认为Agent的大体思路是:
搞个好看的界面
写几句聪明的提示词
让AI按照"思考-行动-观察"的循环跑起来
搞定!
就像给一个聪明孩子换身衣服、教他几句话,他就能帮你干活了。
当然不是这样的!
真正好用的AI智能体,其实是围绕大语言模型搭建的一套超级复杂的"脚手架系统"。
就像盖房子一样,你以为只要有砖头就行,实际上需要地基、钢筋、水电、装修...每一样都不能少。
这套"脚手架"到底有多复杂?
让我用盖房子来比喻:
1. 稳固的地基(KV-Cache设计)
打个比方: 就像房子的地基,必须够结实
问题: AI每次思考都要重新"回忆"之前说过的话,就像健忘症患者
解决: 设计一套"记忆系统",让AI能快速调取之前的对话,不用每次都从头开始
效果: 对话速度快了,还不容易"失忆"
2. 清晰的蓝图(复述机制 & 文件系统)
打个比方: 就像给工人一张施工图,还给他一个工具箱
问题: AI容易"跑偏",忘记自己要干什么
解决:
让AI定期"复述"一遍任务目标(就像工人时不时看看图纸)
给AI一个"文件夹"存放工作草稿和工具
效果: AI不容易迷路,工作更有条理
3. 精准的护栏(屏蔽机制)
打个比方: 就像高速公路的护栏,不让车跑偏
问题: AI有时会"胡思乱想",产生无关内容
解决: 不是删掉这些内容,而是暂时"屏蔽",让AI专注当前任务
效果: AI更专注,但创造力还在
4. 智能的事故分析系统(保留错误信息)
打个比方: 就像飞机的黑匣子,记录每次事故
问题: AI出错后,我们不知道哪里出了问题
解决: 把每次错误都记录下来,分析原因
效果: AI越用越聪明,同样的错误不会犯第二次
为什么要这么复杂?
答案是:必须的!
就像你不能指望一个刚学会说话的孩子立马成为律师,AI大语言模型虽然很聪明,但要在复杂的现实世界中可靠地工作,就需要这套"外骨骼"来支撑。
真正的AI智能体不是"AI + 界面"那么简单,而是一个精密的工程系统:
不是装修,是盖房子
不是训练,是工程
不是给AI穿衣服,是给AI装外骨骼
