Nature对话OpenAI首席科学家AI将有能力进行创新研究
除了润色论文、编写代码,AI还能够为科研做些什么?
《Nature》杂志就人工智能能否产出原创性科学成果、AGI的发展前景以及公司即将发布的开源模型等议题,对Jakub Pachocki进行了专访。
Jakub Pachocki自2024年以来一直担任该公司的首席科学家。他于2017年从学术界加入OpenAI,领导公司最先进的AI系统的开发,这些系统旨在处理科学、数学和编码方面的复杂任务。
以下是专访内容:
- 科学家们正日益广泛地采用推理模型。您认为这类模型在未来五年将发挥怎样的作用?
目前,人类可以与模型交谈,但它仍然只是一个需要持续指导的助手。我认为这一现状将发生根本性改变。
我们已经观察到,类似Deep Research这样的系统,已能在无人监督的情况下运行10-20分钟并产出有价值的内容。不过,现在用来处理这些问题的计算资源其实很少。
如果是那些尚未解决的科研问题,那确实值得投入更多的计算资源去研究。我预计未来将出现真正具备创新研究能力的人工智能。
- 强化学习对于构建OpenAI的推理模型具有怎样的重要性?
ChatGPT最初版本包含无监督预训练阶段,在这个阶段,模型通过海量数据建立“世界模型”。随后我们通过强化学习结合人类反馈,从中提炼出实用助手。
最新推理模型的进展实际上提升了强化学习阶段的重要性:我们不仅从中提取知识,更让模型形成了自主的思维方式
现在的问题是,这些学习阶段是否仍应被割裂看待?推理模型的思考能力并非凭空产生,而是植根于预训练获得的基础。我的研究重点正是探索预训练与强化学习阶段的融合机制,以及二者之间的相互作用。
- 您提到模型具备"思考"能力。它们真的在进行推理吗?还是说只是在模拟类似推理的过程?
可以说这是一种推理形式,但这并不意味着它与人类的推理相同。
预训练模型虽然学习了世界知识,但它并没有真正意识到它是如何学到这些知识的,也没有任何关于何时学到了什么的时间顺序概念。
但我确信有充分证据表明,模型能够发现新颖见解。
- OpenAI首席执行官Sam Altman表示公司将很快发布自2019年GPT-2以来的首个开源模型。您能透露相关计划吗?
我对此非常期待,特别是能够为研究人员提供可下载并进一步训练的开源权重模型。随着模型能力提升,我们更需审慎考量不同部署方式的社会影响。
出于安全考虑,我们很难开放最前沿模型的权重。我的目标是发布优于现有开源模型的产品。
- 您如何定义AGI?认为何时可能实现?
我的时间预测和定义标准都已发生重大变化。
读研时,我认为攻克围棋是AGI里程碑,预计需要数十年。但2016年AlphaGo获胜彻底改变了我的认知。
2017年加入OpenAI时,我还是公司最大的怀疑者之一,但技术突破速度远超预期。
图灵测试取得重大进展后,人们质疑AI的数学和问题解决能力——如今这些领域也取得长足进步,最难基准测试可能很快被超越。
现在我关注的重大里程碑是AI产生实际可衡量的经济影响,特别是开展创新研究的能力,这最接近我过去对AGI的想象。
在这个十年结束前,我对这方面取得的重大进展充满期待。甚至在今年,我预计AI几乎可以自主生产有价值的软件,尽管可能不会解决重大科学问题。