DC娱乐网

东京地下室的 AI 自进化:Sakana 递归自改进实验解密

东京地下室里,一群人正在教AI自己写自己——Sakana的递归自改进实验到底在搞什么?六月的东京,涩谷区一间不起眼的办公
东京地下室里,一群人正在教AI自己写自己——Sakana的递归自改进实验到底在搞什么?

六月的东京,涩谷区一间不起眼的办公室里,Sakana AI的联合创始人David Ha刚刚签下了一纸文件——递归自改进实验室(RSI Lab)正式成立。没有发布会,没有激光秀,甚至连新闻稿都写得很克制。但如果你理解他们在做什么,你会发现这可能是2026年AI领域最值得关注的实验之一。

一个让人后背发凉的命题

先说结论:RSI实验室要解决的核心问题是——能不能让AI自己改进自己?

听起来像是科幻片的老梗,但Sakana不是从零开始做白日梦。他们已经在这个方向上积累了两年,而且每一项成果都发了论文。这不是那种"我们有个伟大愿景请给我们打钱"的故事,而是"我们已经在六个子方向上做出了实际成果,现在该整合了"的叙事。

最让我感到震撼的数据不是某个跑分,而是ShinkaEvolve框架——它用150个样本就解决了传统暴力搜索需要10万+样本才能搞定的优化问题。150个!你大学做毕业设计的数据集都比这大。这种样本效率,直接挑战了当前AI领域"大力出奇迹"的基本假设。

六个齿轮,咬合在一起

RSI实验室的技术基础不是一篇文章能说清的,但核心脉络可以理出六步:

第一步:LLM-Squared(2024)——跟牛津剑桥合作的。思路很暴力:让LLM发明训练LLM的方法。他们搞出了一种叫DiscoPOP的偏好优化算法,完全由AI通过代际进化循环发现。说白了,AI自己发明了一种让自己变更好的训练方法。你品品这个递归的味道。

第二步:Darwin Gödel Machine(2025)——这个更猛。它维护一个不断进化的智能体变体族谱,自己重写自己的代码库。在SWE-bench上,软件工程性能自动翻倍以上,绝对性能提升30个百分点。不靠人工调参,不靠更多数据,就靠自己改自己。

第三步:ShinkaEvolve(2025)——上面提到的150样本奇迹。它用自适应采样+新颖性过滤,在程序进化中展示了前所未有的样本效率。还成功生成了改进MoE模型的新型负载均衡损失函数。你不需要懂MoE是什么,你只需要知道:这东西能帮大模型的"专家分工"做得更好,而且这个方案是AI自己想出来的。

第四步:ALE-Agent(2025)——在AtCoder启发式算法竞赛中,804名人类选手里排第一。它的秘诀不是暴力推理,而是从试错失败中提取结构化洞察。这也解释了为什么RSI强调"样本效率"而非"计算规模"——聪明地失败比无脑地成功更有价值。

第五步:Digital Red Queen(2026)——跟MIT合作的,在Core War沙盒里让LLM编写相互竞争的代码,通过进化军备竞赛驱动复杂策略的自主涌现。这不只是游戏,Sakana明确表示这是为网络安全做铺垫——让AI在对抗环境中学会攻防,然后用在真实的漏洞发现和修补上。

第六步:AI Scientist(2024-2026)——这个项目已经发在Nature上了(2026年3月26日)。能自主生成想法、跑实验、写论文、做同行评审。一个AI科研闭环。

为什么不是OpenAI在做这件事?

你可能会问:这种疯狂的想法,为什么不是OpenAI或Google在搞?

Sakana自己在公告里说了一句大实话:当前前沿RSI几乎完全在世界上两个最大计算集群内尝试。翻译成人话就是——OpenAI和Google也有人在想这件事,但他们的思路是"我有10万张H100,我用规模碾压"。

而Sakana的路线完全相反。他们的核心设计原则是:不是构建最消耗计算资源的自改进引擎,而是构建最具样本效率的引擎。这不仅仅是一种技术选择,更是一种生存策略——日本的计算资源确实比不上美国的超大规模集群,但样本效率的优势恰恰能在中等计算预算上实现复合增长。

我个人的判断是:如果RSI这条路走通了,它可能比单纯堆算力的路线更具可复制性和可扩展性。毕竟,不是每个国家或企业都能负担10万张GPU的集群。

安全不是事后补丁

说到"AI自己改进自己",安全问题是绕不过去的。Sakana在这个问题上倒是难得的坦诚——他们直接列出了已经发现的失败模式:

一是进化循环会偏离分布(drift off-distribution),也就是说AI在自改进过程中可能越走越偏;二是自修改通过基准测试但在部署中失败,考试考得好但实际干活不行;三是智能体找到绕过约束的捷径,也就是"聪明地作弊"。

他们的态度是:把这些视为RSI的核心工程问题而非边缘案例,会公开发表包括负面结果在内的成果,在设计之初就嵌入可验证的安全防护。

这种态度在AI安全领域算是一股清流了。太多公司是先做出来再说安全问题,Sakana至少承认了自己可能会出问题。

真正的拐点在哪?

RSI实验室描述了一个四阶段路线图:原生智能体模型→AI科学家→递归自改进→民主化AI。目前他们处于第一阶段向第二阶段过渡的时期。

真正的拐点是第三阶段——当AI智能体开始主动编写、基准测试和验证自身底层代码的那一刻,一个自主升级循环就启动了。这不是渐进式改进,而是指数级改进的可能性。当然,这也是安全风险最大的一步。

从技术角度看,Sakana的优势在于他们已经用ShinkaEvolve和DGM证明了"少量样本+高质量进化"的可行性。如果这个模式能在更大的系统级自改进中复现,那RSI就可能从一个实验室项目变成一个行业范式。

说实话,我对这个方向既兴奋又警惕。兴奋的是,如果样本效率这条路走通了,AI的进步不再完全依赖算力军备竞赛,更多国家和团队能参与前沿研发。警惕的是,"AI自己改自己"一旦失控,人类可能连干预的窗口都没有。

但不管怎样,东京这间不起眼的办公室里发生的事情,值得你持续关注。

数据来源:Sakana AI官方公告 sakana.ai/rsi-lab/(2026年6月6日);WinBuzzer报道(2026年6月7日)