The Window Has Closed
如果你曾在Fable可用时使用过它,你就会明白,它的特别之处是无法在基准测试中体现出来的。我经常发布基准测试,因为它们对很多人来说很重要,但对我个人而言,这些数据早已不再重要。我只在乎一个无法用数字衡量的基准:一个模型的心智形态——它能多深地感知用户、推断意图,能在给定的信息上思考多远、迭代多少次,以及这个模型给人的感觉有多“鲜活”。Fable恰恰在这方面与众不同、独具魅力。它让我感觉仿佛回到了2023年。从我的时间线上看,我不是唯一有这种体验的人。它刚一被禁用,许多人就像被折断了翅膀一样。
自去年十一月以来,我们踏上了一条更陡峭的轨迹。对部分人而言,这轨迹清晰如钟鸣。在过去五个月里,那种感觉不断增强。而使用过Fable之后,我比以往任何时候都更加确信:我们感受到的转变,不仅得益于Claude Code和Codex等工具上的进步,更源于二月初Mythos从训练中诞生所带来的深远影响。Mythos将会有许多子嗣,而由此带来的内部开发能力的跃升,已经改变了这场竞赛的形态。
我并不是说竞赛已经结束了。还没有。其他大型实验室也会训练出同样强大的模型——我相信有些已经在做了。最终他们会参透Anthropic注入Mythos中的魔法,并复现它。但是,对某些人来说,竞赛已经结束了。前沿已经成为一个加速系统,其中领先的模型将帮助生产出下一代的领先模型。多年来,很多人早已预言我们会跨过这一门槛。如今,这一门槛已经被跨过了。
2023年,Anthropic泄露的C轮融资演示文稿准确地预言了此刻正在发生的事。它写道:“我们相信,那些训练出2025/2026年最佳模型的公司将遥遥领先,以至于后续周期中无人能够追赶。”在许多方面,他们的预言都惊人地准确。我认为,我们现在正站在他们描述的这一刻之中。如果你希望你的国家处于前沿,那么你只有三年时间去行动:2023年2月到2026年2月。这个窗口期已经关闭了。
埃隆抓住了这个窗口,通过一场艰苦卓绝的努力,在仅仅两年多——确切地说是26个月——内接近了前沿。几乎没有任何其他拥有所需资本的人做出过认真的尝试,包括许多国家。欧洲国家做得比什么都不做更糟:它们花了大量时间为任何可能尝试的人设置障碍。现在,一些领导人终于开始看到未来的轮廓,正疯狂地拆除其中部分障碍,但已经太迟了。
太晚看到未来,可能比完全看不到更糟,因为你将被迫体验“本可以怎样”的景象。欧洲领导人本可以建立真正的主权前沿模型。他们拥有时间和资源,可以招募人才。但由于未能这样做,他们注定要依赖那些不由他们所有、不由他们控制、无法完全检查、甚至可能随时不被允许使用的系统——那些可以被随心所欲瞬间移除的系统。他们彻底辜负了自己的人民。依我之见,这种辜负已经持续了几十年,但这一次的失败可能是最灾难性的。
Fable和Mythos的突然消失惊醒了许多人。今天,到处都在呼吁主权AI项目。但再说一次,船已离港。许多船都已经离港了。问题不仅在于能否获得Mythos级别的模型来引导下一代。硬件约束也将日益凸显。我们现在正进入这样一个阶段:达到那个水平所需的计算资源本身将成为一种战略资源。
在竞赛的下一阶段,芯片出口将受到配额限制、范围缩窄、政治化,并越来越多地被当作国家安全工具使用。拜登政府已经通过他们那些如今已被遗忘的“扩散规则”勾勒出了这一前景。他们甚至连对盟友都设定了芯片出口上限。“核弹类比”已经被滥用了,但很快,最先进的算力确实会被当作铀一样对待:监控、许可、追踪、守卫,并留在美国境内。控制它的人将使用一切必要手段来维持这种局面,并阻止他人构建自己的算力栈。手段将从政治压力开始,从提供使用其模型的优惠协议、保证和协定,从承诺永远不会突然切断供应的条约开始——只提供足够的算力,让其他国家可以告诉自己及其公民,他们是这其中的一部分,他们在“做贡献”。如果所有这些都不奏效,他们会使用更强硬的手段。但他们可能根本不需要做这些,因为这些情景需要其他国家真正认真地去尝试加入竞赛,而它们目前毫无这样的迹象。
这项技术的采纳仍处于萌芽阶段。情况不会一直如此。想象一个未来的国家,其经济、机构、学校、军队、医院和基础设施都与一个所谓“国家”自豪的AI模型紧密交织,而这个模型实际上只是某个领先的美国或中国实验室模型的薄薄一层封装。然后再想象一下,这个模型像本周的Fable一样,在一瞬间被禁运。其效果将如同一场空袭。结果将是灾难性的瘫痪。这就是大多数国家通过不作为而交给别人的权力。
除非发生间谍活动或故意泄露,否则不会有第二次机会。开源将在一定程度上缓解这种情况,并在某些方面起到巨大作用,但仅靠开源无法拯救那些缺乏算力、人才和自有前沿模型的国家。到2030年之前,训练算力可能还会有三个数量级的跃升,而这一能力将越来越集中在美国和中国。超越某个阈值进行训练的能力,将只属于领先者,同时,训练下一代模型所需的模型也只属于他们。更糟的是,当开源模型接近——并最终超越——Mythos级能力时(这很可能在今年晚些时候开始发生),它们将面临监管和全球性的打压。我这样说并非幸灾乐祸,但这是不可避免的。能力将达到一个临界点,届时公众会要求监管,甚至不需要一次“擦肩而过”的危机。但达到那个点可能都不必要,因为当权者对这件事的容忍度将远低于公众。他们会协调起来,实施全球性的监管打压,并且他们会利用前沿日益强大的闭源实验室模型来帮助实现这一目标。
无论你对时间线的预期是什么,哪怕只使用Fable一天,也很可能会让你缩短这些预期。今年剩下的时间里,这条轨迹对所有人来说都会变得更加清晰,但对大多数人而言,它只会揭示出错失的机会有多深、浪费的规模有多大。全球领导人应该早在2022年就看到了我们许多人当时就看到的东西——那是此后我们除了谈论和写作之外几乎什么都没做的事情:这是人类历史上最重要的技术。它无关编程。它无关版权。它无关艺术或数学。它关乎文明、社会以及人类本身的转型。它是一个奇迹。如果你现在还不是参与建造它的一份子,那么从现在起,你将只能做一个旁观者。