6月5日,一篇来自Anthropic的长文在AI圈刷屏。
这家手握前沿模型Claude、估值正一路狂奔的明星公司,突然向整个行业抛出一个令人意外的提议:
放缓或暂时暂停前沿AI开发。理由是,AI系统正在逼近一个叫“递归自我改进”的临界点。届时,AI将能在没有人类监管的情况下自行迭代,造出更强的下一代AI,进而可能引发失控和社会动荡。
这一消息由《华尔街日报》率先报道,瞬间引爆了全球科技圈的话题热度。
赞成者认为这是AI安全领域亟需的清醒声音,批评者则直接扣上了“营销炒作”“监管俘获”甚至“打压同行”的帽子。
有意思的是,就在几天前的6月1日,Anthropic刚刚秘密向美国证券交易委员会提交了IPO文件,上市估值有望冲破1万亿美元。
一边是几十天内准备登陆资本市场的独角兽,一边是公开呼吁全球同行踩下研发刹车的“安全派先锋”,这两个动作放在一起,怎么看都有一种分裂感。
有人给了一个很辛辣的比喻,这就好比期末考试前,某个成绩最好的学生突然站起来号召全班暂停复习一周。
这种“先喊停”的姿态,究竟是真心实意的风险预警,还是别有用心的战略营销?本文将从多个维度拆解这场刷屏事件的底层逻辑。

要理解这场争议,首先得弄清楚Anthropic到底说了什么。
6月5日,Anthropic发布了一篇名为《当AI开始自我构建》的万字长文,系统阐述了其对AI发展方向的判断。
文章的核心论点是:人工智能正在加速发展,并可能朝着“递归自我改进”的方向演进。换句话说,AI可以自我进化、自己造自己,而人类可能逐渐沦为旁观者。
Anthropic用了大量内部数据进行佐证。截至2026年5月,Anthropic代码库中超过80%的代码都是由Claude编写的,而一年前这一比例还处于低个位数水平。
今年第二季度,一名典型工程师每天合并的代码量是2024年同期的8倍。在难度最高的开放式任务中,Claude的成功率在5月达到了76%,较半年前提升了50个百分点。
文章还预测,到今年年底,Claude编写的代码质量将超越人类编写的代码。
文章提出了AI后续演化的三种可能情境。第一种概率最低,即AI能力停滞在当前水平,但现有技术普及仍将重塑各行各业。
第二种,企业人均生产力成倍暴涨,百人团队可完成过往万人甚至十万人的工作量,知识产业迎来颠覆性变革。
第三种,也是最令Anthropic担忧的。AI将掌握人类创造性研发的全部能力,独立自主设计迭代新版本,人类重心转向AI监管与成果核验,但最大的不确定性在于价值观对齐问题能否解决,“人类有概率彻底失去管控”。
基于这一判断,Anthropic提出了一个大胆的建议:如果能够有效减缓AI技术的发展速度,从而为人类争取更多时间来应对其巨大影响,这或许是一件好事。文章甚至提出要建立一套类似于“核武器协议”的全球性协议来约束AI研发节奏。
IPO在即,是营销还是确有其事?任何关于这场事件的分析,都不可能绕过一个关键事实——Anthropic正站在IPO的大门前。
6月1日,Anthropic向美国证券交易委员会保密递交了S-1注册声明草案,拟进行普通股首次公开募股。据市场预测,其上市估值有望冲破1万亿美元。
一个成立数年的公司,从零到万亿美元估值,这一跃迁本身就是一个巨大的叙事。
在这种情况下发布“暂停AI”的呼吁,不可避免地被放置在IPO背景下重新审视。
有信息安全研究员在分析中直言不讳表示:Anthropic这一发声更多是为了向资本市场证明其研发新模型的边际成本,以及AI未来在各行业新业务场景持续渗透的趋势,文中提到的“彻底改变知识工作和政府服务”部分就是对商业想象力的描述。
综合而言,这个判断不无道理,IPO本质上是一场围绕公司估值的故事会。
Anthropic的价值不依赖于任何一款具体的产品,而取决于资本市场对“AI能做什么”“AI能走多远”“AI的商业天花板在哪里”这三个问题的回答。
而这篇万字长文,恰恰以最危言耸听的方式就是AI要失控了,把这些问题的答案写得清清楚楚。
甚至有观察人士将这种操作戏称为“基于恐惧的营销策略”先渲染恐惧,再标榜自己的能力,从而抢占IPO前的监管话语权和公众注意力。
前华尔街分析师Tae Kim发文指出,这种做法“令人厌倦,它将对整个美国AI行业产生适得其反的效果”。
如果说仅仅因为IPO时间点就全盘否定Anthropic的主张,那未免过于简单化。
在这篇文章背后,还存在另一个值得探究的问题:Anthropic这次提出“暂停AI”,究竟是突发奇想的营销行为,还是一贯主张的自然延伸?
回顾Anthropic的历史轨迹,答案其实相当清晰。自成立以来,这家公司就一直以“AI安全”作为核心理念。
今年2月,Anthropic刚刚发布了一份53页的报告,其中提到新模型已逼近4级AI风险等级,警告AI有朝一日可能会自我逃逸、造成全球失控。这不是该公司第一次拿“自我逃逸”做预警,当然也不会是最后一次。
将Anthropic与其最大竞争对手OpenAI进行横向比较,也能够看到微妙的差异。
谷歌、OpenAI近年来在市场宣传和商业化拓展上高歌猛进,而Anthropic则始终小心翼翼地在“AI安全性”和“AI商业性”之间摇摆。
它的API收入模式使其重心偏向企业客户,而非直接与C端用户大规模交互。这种商业模式的差异,决定了Anthropic更需要在信任和声誉上构建壁垒,也更需要通过“安全至上”的形象获得企业客户的青睐。
此外,有分析认为,任何一家AI实验室的呼吁都必须放在它的“内部矛盾”中进行理解。宾大沃顿商学院教授Ethan Mollick提醒,AI实验室从来不是单一主体:
里面既有追逐商业利益的营销、律师和资本算计,也有一门心思追逐下一代模型的研究员,还有真心忧虑未来的“哲学王”式人物,几股力量拧在一起,才有了这种又踩刹车又踩油门的拧巴姿态。
这意味着,Anthropic的文章并非纯粹的“营销工具”,也并非纯粹的“学术警告”,而是多重动机糅合在一起的产物。营销和担忧完全可以同时成立。

理解Anthropic的主张,绕不开一个人,CEO达里奥·阿莫代伊。
这位年仅40多岁的AI技术领袖,在硅谷的名声相当两极。在外界看来,他是鼓吹风险的“末日论者”,是阻挡AI开放发展的“控制派”;
而在支持者眼中,他则是为AI踩下“安全刹车”的少数清醒者。他在2025年几乎“火力全开”,公开预测AI将在短期内淘汰50%的初级白领岗位,反对“十年暂停AI监管”的提案,并呼吁对华实施更严厉的芯片出口管控,引发产业界的激烈争论。
他还因公开倡议出口管制惹恼了英伟达CEO黄仁勋,并因与OpenAI的竞争关系频频隔空交锋。
阿莫代伊为何对AI安全如此执着?一个广为人知的个人故事或许提供了部分答案。
他二十出头时,父亲因一种罕见的疾病去世。四年后,有人攻克了这种病的疗法,使其死亡率从50%降到5%以下。
就差那么几年。阿莫代伊曾说:“有人攻克了这个病的疗法,救了一些人的命,但本来还可以救更多。”
这构成了他所有行为的情感底色。他比大多数技术从业者更清楚技术加速的价值,因为加速可能意味着挽救更多的生命;
但正因如此,他也比许多人更恐惧失控的代价,因为一旦失控,所有那些本该被挽救的生命可能再也追不回来。
他曾对媒体表示:“我父亲因那些本可能晚几年就出现的疗法而离世。所以当有人说我想放慢脚步时,我感到非常、非常愤怒。”
这种深刻的矛盾性贯穿于他的每一次公开表态中。在一个更早的访谈中,他坦言:“我确实是对AI能力提升最乐观的人之一,但越接近强大AI系统,我就越觉得应该站出来,以最清晰、最坚定的方式告诉大家:它真的来了。”
这就解释了Anthropic此举的内在张力:一个对AI发展速度最有信心的人,却最先喊着要放缓,因为他对“加速度”的认知,反而让他比任何人都清楚地看到了危险近在眼前。

然而,仅凭创始人个人信念来解读整件事,显然不够。
在硅谷,一个早已流行的批评是:Anthropic的“安全第一”主张,本质上是“监管俘获议程”,即借监管之名打压竞争对手,尤其是开源模型。
这个批评并非空穴来风。白宫前加密货币和AI事务主管戴维·萨克斯就曾公开指责Anthropic的领导层推行“监管俘获议程”,称此举或催生封杀开源AI模型的政策。
另外,Anthropic限制发布其网络安全模型Mythos的做法(该模型能够发现代码中的漏洞和问题),也被不少观察者看作一种巧妙的宣传手段:既炫耀自家产品能力,又以“安全”为由拒绝全面开放。
从产业竞争的结构性视角来看,这一逻辑更有说服力。在当前的AI版图中,大模型的竞争既存在于OpenAI、Anthropic、谷歌等巨头之间,也存在于闭源和开源两条路线之间。
开源模型成本更低、部署更灵活,对闭源商业模型的冲击正在日益加大。如果全球监管体系真的采纳了Anthropic的主张,最受伤的未必是与Anthropic同处闭源阵营的OpenAI。
毕竟两者面对的监管压力几乎对等,而是开源模型生态。一旦各国出台针对AI开发的严格许可和管控机制,开源模型的开发和传播路径将首当其冲。
这种“以安全之名限制竞争”的逻辑,在科技史上并不罕见。
从微软在操作系统市场面对开源挑战时的专利诉讼,到汽车行业以“安全标准”限制新进入者,先行者利用规则设置壁垒是所有成熟产业的经典打法。
Anthropic的“暂停AI”呼吁,如果从产业竞争的角度去审视,就不难发现它在逻辑上与此高度吻合。
一石激起千层浪,或者真相确实存在?Anthropic的呼吁刚一发布,资本市场和产业界就迅速做出了反应。
在资本市场上,这一消息叠加博通公布的二季度营收数据不及预期,令AI交易受到明显冲击,从美股到日股均出现波动。有分析人士指出,Anthropic对AI风险的警示在客观上加剧了资本市场对AI泡沫的担忧。
产业界的声音则更加多元。沃顿商学院教授Ethan Mollick表示,文章值得一读,虽然有一些自省、一些营销内容,但也有不少Anthropic对AI近期和未来可能性的真诚看法。
他甚至进一步指出,Anthropic内部存在多重利益主体,既有商业利益驱动的团队,也有真心忧虑未来的安全派人物。
反对的声音同样响亮。图灵奖得主、“深度学习三巨头之一”、Meta前副总裁杨立昆就明确表示不认同Anthropic描述的生存风险或“递归自我改进”可能性。
在他看来,基于大语言模型的前沿AI系统永远无法对标人类的智力,AI只是高效工具,智能水平仅等同于猫。
这种观点代表了AI领域另一派相当有影响力的声音:所谓“AI毁灭论”,更像是一种技术界内部的自我神话。
有人还从实证角度对Anthropic的主张提出了质疑。有专家用一个通俗的比喻拆解了Anthropic的推理逻辑:“这就好比一家造车新势力,其超级工厂里的机械臂组装汽车速度比过去快了10倍,完全替代流水线上的装配工人已经没有任何问题,但这并不代表它就能独立完成一款全新汽车的完整设计与研发。”
AI能够高效地完成代码编写和工程任务,与AI能够独立设计下一代颠覆性系统之间,存在巨大的逻辑鸿沟。将前者等价于后者,更像是一种服务于估值叙事的技术焦虑渲染。
在这种众声喧哗之中,很难简单地给Anthropic下“真心示警”或“炒作营销”的二选一结论。更接近事实的判断可能是:两者同时存在,且彼此并不矛盾。
有几个事实值得放在一起看。
事实一:Anthropic确实处在IPO的关键窗口期。这个时间点本身就是一个极为有力的信号——任何一家准备登陆公开市场的公司,都会慎重选择每一个对外发声的时机。
事实二:Anthropic的创始人阿莫代伊和公司核心层多年来确实在持续推动AI安全议题,其态度并不像是临时起意。
事实三:文中披露的内部数据,80%代码由Claude生成、工程师效率提升8倍、模型自主完成任务时长每四个月翻一番。这些并非凭空杜撰,而是可以交叉验证的内部运营数据。换句话说,担忧有真实的数据基础,营销也有真实的商业动因,两者并不相互排斥。
事实四:呼吁建立类似于“核武器不扩散条约”的全球AI研发协议,在理论和操作上存在巨大的先天缺陷。正如文章自身也承认的,AI训练相比导弹发射更容易隐匿,当有人暂停研发时,恰恰是那些最不守规矩的参与者获得领先优势的时机。
要在全球范围内强制暂停AI研发几乎不可能,因为无论是经济利益还是国家安全,AI发展的利害关系都过于重大,没有任何超级大国会愿意在此刻主动踩下刹车。
事实五:Anthropic曾经明确反对过长时间的AI研发暂停,其创始人本人更是公开批评过“十年暂停AI监管”的提案。这表明Anthropic并非本质上的“反对进步派”,而更像是一个试图在“速度”和“安全”之间寻找平衡的玩家。
如果这一次的呼吁是真的相信全球AI应该集体暂停,那它与此前立场之间确实存在某种张力。
这些事实汇聚在一起,似乎指向一个共同的结论:这次“暂停AI”的呼吁,更像是一份精心制作的“战略声明”。
它既为即将IPO的公司创造了新的叙事高度,又保持了Anthropic一贯的“安全派”人设,同时还以披露内部数据的方式向资本市场递送了极具说服力的“技术护城河证明”。
但即使其中包含营销的成分,也不能因此否定其中对AI风险的真实关注。在一个营销泛滥的年代,动机的复杂性并不意味着观点本身的虚假性。
AI安全是一个需要认真对待的命题抛开Anthropic的动机不谈,其呼吁所触及的核心问题——AI研发的“囚徒困境”——是一个真实存在的结构性难题。
当前的全球AI竞赛有一个显著特征:领先者没有放慢脚步的内在激励,落后者更没有放慢脚步的任何理由。每一个参与者都清楚地知道,自己慢一步,对手就可能领先三步。在这种压力下,关于“安全”的共识很难转化为任何实质性的行动。
这正是Anthropic所谓的“全球协调机制”构想所面临的死穴。文章中说得很明白:“如果没有全球协调机制,企业和政府将在竞争和地缘政治压力下,对安全问题作出艰难决策”。
但问题在于,这个协调机制本身就是囚徒困境中最难建立的环节。正如Anthropic在文章中自己承认的,“AI训练项目远比导弹发射井更容易隐匿。当其他人暂停时,谁继续前进谁就可能取得领先”。
这种博弈困局说明了一个令人不安的事实:即使所有人都同意AI存在巨大风险,即使所有人都真诚地希望慢一点、安全一点,但在现有的国际竞争框架和商业逻辑下,谁也无法真正停下来。
这就是AI竞赛的残酷本质:它不取决于个体的善意,而取决于集体行动的结构性缺失。
从这个意义上看,Anthropic的呼吁也许不是答案本身,但至少发出了一个信号:技术的列车正以指数级速度前进,而轨道的另一端,很多问题尚未得到充分的思考。
无论Anthropic被解读为真心示警还是营销炒作,有一个结论正在成为跨行业的隐性共识:AI的安全性研究不能再被置于次要位置。
AI安全风险确实存在,未来会是“核武器级别”的工具,极度扩散会带来威胁。
这种判断并非危言耸听。今年早些时候,多伦多大学的一个研究团队展示了AI工具如何被用来创建一种新型AI“蠕虫”,这种蠕虫可以在设备间传播时不断调整其黑客策略,最终掌控庞大的计算网络。
Anthropic提出要建立一套类似于核武器协议的全球性协议来约束AI研发节奏,虽然实现难度极大,但这一提议本身有其价值。
从这个角度看,Anthropic的文章至少做对了一件事:它让“AI安全”从一个技术圈内的喃喃自语,变成了一场全球范围的公众讨论。
即便这篇文章有营销的成分,它的传播效果依然是不争的事实,整个科技圈、金融圈和政策圈都在谈论AI失控的可能,都在思考“递归自我改进”的技术边界,都在追问“我们到底有没有做好准备”。
此外,Anthropic在文章中区分出的三种可能情境也为理性讨论提供了一个有意义的框架。第一种是技术停滞;第二种是AI全面提升生产力但伴随滥用风险;第三种最极端——AI自主迭代,人类失去控制。真正令Anthropic担忧的是第三种,也是普通人最需要关注的那个。无论最终概率有多大,只要它不为零,人类社会就应当提前进行制度、技术与伦理上的准备。
写在最后如果必须用一个词来形容Anthropic这次的行为,最贴切的或许是“矛盾体的自白”。
一个跑在最前面的领跑者,突然回过头来对所有人喊“慢一点”。你可以说这是虚伪,因为领跑者喊慢是为了巩固自己的领先地位;你也可以说这是真诚,因为只有真正看清楚跑道尽头是什么的人,才有资格说“慢一点”。
但这些争论背后,有一个事实正在变得愈发清晰:当一个最懂AI的团队公开说出“我担心失控”的时候,所有人都不应该一笑而过。
毕竟,在这个行业里,既懂技术又有话语权的人并不多。而这其中,愿意押上自己的声誉去喊一个可能被万人嘲讽的“刹车”的人,更是少之又少。营销和示警从来不是二选一的命题。或许我们真正应该关注的,不是他们的动机,而是那个动机背后的信号——
那个信号就是:AI真的跑得太快了。
快到一个亲手建造它的人,都开始感到恐惧。
这场关于“暂停AI”的争论没有结论。但它的存在本身就说明了太多:AI正在从“技术话题”演变为“文明议题”。而一个文明如何与它创造的智慧共处,正在成为我们这个时代最重要且最紧迫的问题。