
Anthropic的联合创始人杰克·克拉克最近做了一个判断:到2028年底,一个AI系统将有60%的概率能够自行创造出比自己更强大的后代。
这不是科幻小说里的情节,而是AI领域内部正在严肃讨论的技术路径,它有一个专有名词:递归式自我改进。
从"帮人写代码"到"自己造自己"要理解这件事有多不寻常,先看一组数字。Anthropic在2026年5月公布,其发布的代码中超过五分之四是由旗下AI系统Claude编写的。而就在Claude Code这个编程代理于2025年2月推出之前,这个比例还只是"个位数的低百分比"。
这个变化发生在不到一年半的时间里。
AI写代码已经不新鲜,但当AI开始写用于改进AI自身的代码时,性质就完全不同了。递归式自我改进描述的正是这样一个过程:模型A构建出更强的模型B,模型B再构建出更强的模型C,如此循环,且无需等待人类介入每一个环节。每一代模型都比上一代更擅长完成这个任务,理论上迭代速度会越来越快。
2025年底成立的初创公司Recursive Superintelligence,名字本身就直接宣告了它的目标。公司联合创始人蒂姆·罗克特谢尔在接受彭博采访时表示,自我改进的AI在两年内可以实现,也就是2027年前后。他的表述不是"也许有可能",而是"可以实现"。
与此同时,OpenAI据报道计划在2026年9月前部署具备实习研究员级别能力的AI研究代理,并在2028年前推出能够完全自主运作的AI研究代理。如果这些代理能够接管AI研究本身,意味着改进AI的工作将不再主要依赖人类研究员,而是由AI系统来驱动。
速度可能是这件事最危险的属性递归式自我改进让AI安全研究者感到紧张,核心原因不是AI会变强,而是变强的速度可能超出任何人的控制能力。
著名AI安全学者斯图尔特·罗素曾经这样描述这种担忧:一个智商相当于150的AI,如果能够改进自身算法,可能在短时间内将自身能力推进到智商170的水平,而那个新版本又能继续迭代。每一步跨越都在压缩下一步所需的时间。
这与过去的技术进步逻辑根本不同。蒸汽机、互联网、智能手机,每一次技术革命都有自然的部署周期,给社会留下了调整和适应的时间。递归式自我改进的理论曲线是指数级的,而指数曲线在平缓阶段看起来没什么动静,在陡升阶段会让人完全措手不及。
英国人工智能安全研究所的评估报告指出,前沿AI模型在自主完成复杂任务方面的能力,每隔几个月就会翻一番。这个基准本身还只是衡量现有能力的,并不包含递归自我改进可能带来的额外加速。
arXiv上2026年初发表的一项研究试图在数学上界定大语言模型递归自我训练的极限,结论是存在理论上的收敛边界,但这些边界是否能在实践中有效约束真实系统,目前还没有共识。
Sakana AI于2024年推出的"AI科学家"系统,已经能够自动完成从提出假设、设计实验到撰写论文的完整科研流程,并持续运营至2026年。这还不是递归式自我改进,但它是一个清晰的方向信号:AI正在接管原本被认为只属于人类的创造性认知工作。
世界经济论坛在2026年5月发布的报告指出,随着AI代理承担起真实的决策责任,各机构的治理框架已经跟不上技术能力的扩张速度。问题不再是"AI能不能做这件事",而是"谁来决定AI可以做什么,以及出了问题谁来负责"。
这个问题目前没有令人满意的答案。
递归式自我改进距离真正实现可能还有几年时间,也可能更短。但真正值得关注的,不只是它到来的那一刻,而是我们现在是否有足够清醒的意识,在那一刻到来之前,把规则和边界想清楚。