一项新研究的作者认为,现有的大语言模型架构可能无法支撑实现人类级人工智能所需的问题解决能力。

最新研究表明,当今最流行的人工智能工具在架构上的限制,可能会制约它们能够达到的智能上限。
2月5日发表在预印本平台arXiv上的一项研究指出,现代大语言模型在其问题解决逻辑中天生容易出现断裂,即所谓的「推理失败」。
当大语言模型丢失了可靠完成任务所需的关键信息,导致对看似简单的问题给出错误答案时,就发生了推理失败。该论文是对现有研究的综述,专门考察了Transformer模型——这是一种神经网络架构,支撑着包括ChatGPT、Claude和Google Gemini在内的流行AI聊天机器人。
根据大语言模型在「人类最后考试」等评估中的表现,一些科学家认为,底层的神经网络架构有朝一日可能催生出能够达到人类级认知的模型。然而,研究人员指出,虽然Transformer架构使大语言模型在语言生成等任务上极为强大,但它也抑制了实现真正人类级推理所需的那种可靠的逻辑过程。
「大语言模型已展现出卓越的推理能力,在广泛的任务上取得了令人瞩目的成果,」研究人员在论文中表示。「尽管取得了这些进步,严重的推理失败依然存在,甚至在看似简单的场景中也会发生……这种失败被归因于模型缺乏整体规划和深度思考的能力。」
大语言模型的局限性
大语言模型在海量文本数据上进行训练,通过逐词预测一个合理的答案来响应用户的提示。它们通过将称为「标记」的文本单元串接在一起来实现这一点,这些串接方式基于从训练数据中学到的统计模式。
Transformer还使用一种称为「自注意力」的机制来跟踪长文本序列中单词和概念之间的关系。自注意力机制加上庞大的训练数据库,使得现代聊天机器人非常擅长对用户提示生成令人信服的答案。
然而,大语言模型并不进行传统意义上的任何实际「思考」。相反,它们的响应由算法决定。对于需要多步骤真正解决问题的长任务,Transformer可能会丢失关键信息,并退回到从训练数据中学到的模式。这导致了推理失败。
「这一根本弱点不仅限于基本任务,还扩展到数学问题的组合、多事实声明验证以及其他本质上具有组合性的任务,」研究人员在论文中表示。
推理失败也是为什么大语言模型在被用户告知回答错误后,常常仍然重复同样的回复;或者对同一问题的不同表述方式给出不同答案——即使被要求逐步解释其推理过程也是如此。
英国阿兰·图灵研究所的高级研究数据科学家费德里科·南尼认为,大语言模型通常呈现为推理的东西,多半只是表面功夫。
「人们发现,如果你告诉大语言模型不要直接回答,而是『一步步思考』并先写出推理过程,它往往能得到正确答案,」南尼告诉媒体。「但这是一种技巧。这不是人类意义上的真正推理——它仍然只是装扮成思维链的下一词元预测,」他说。「当我们说这些模型『推理』时,我们实际的意思是,它们写出一个推理过程——听起来像是一串合理的推理链条。」
现有AI基准测试的不足
研究人员发现,当前评估大语言模型表现的方法在三个关键方面存在不足。第一,重新表述提示词可能会影响结果。第二,基准测试随着使用次数的增加而退化并受到污染。第三,它们只评估最终结果,而不是模型得出结论所用的推理过程。
这意味着当前的基准测试可能严重高估了大语言模型的能力,并低估了它们在现实使用中失败的频率。

「我们的立场不是说基准测试有缺陷,而是它们需要进化,」该研究的合著者、加州理工学院的计算机科学与机器人学学生宋培阳通过电子邮件表示。同样地,南尼表示,基准测试往往会渗入到大语言模型的训练数据中,这意味着后续的大语言模型会学会如何欺骗这些基准测试。
「除此之外,既然模型已投入生产环境,使用本身也成了一种基准测试,」南尼说。「你把系统摆在用户面前,看看哪里出问题——这就是新的测试。所以是的,我们需要更好的基准测试,也需要减少依赖AI来检查AI。但这在实践中非常困难,因为这些工具已经融入我们的工作方式,直接使用它们极其方便。」
通往通用人工智能的新架构?
与近期其他研究不同,这项新研究并不认为神经网络方法在追求通用人工智能的道路上是死胡同。相反,研究人员将其比作计算机的早期时代,指出理解大语言模型为何失败是改进它们的关键。
然而,他们确实认为,仅仅在更多数据上训练模型或扩大模型规模,不太可能独自解决这个问题。这意味着,开发通用人工智能可能需要一种根本不同的模型构建方法。
「神经网络,尤其是大语言模型,显然是通用人工智能图景的一部分。它们的进展是非凡的,」宋说。「然而,我们的综述表明,仅靠扩展规模不太可能解决所有推理失败……[这意味着]达到人类级推理可能需要架构上的创新、更强的世界模型、改进的鲁棒性训练,以及与结构化推理和具身交互的更深度融合。」
南尼对此表示赞同。「从心智哲学的角度来看,我认为我们基本上已经找到了Transformer的极限。它们不是你构建数字心智的方式,」他说。「它们对文本的建模极其出色,以至于几乎无法分辨一段文字是出自人类还是机器之手。『但这就是它们的本质:语言模型……这种架构的潜力是有限的。』」
如果朋友们喜欢,敬请关注“知新了了”!