DC娱乐网

【长期主义】第363期智能说:DeepMind CEO Hassabis深度专访

2025 All-In峰会上,谷歌DeepMind创始人、CEO Demis Hassabis接受专访,分享关于AI发展

2025 All-In峰会上,谷歌DeepMind创始人、CEO Demis Hassabis接受专访,分享关于AI发展与AGI未来深刻见解,涵盖AI与科学发现、DeepMind角色定位、AI模型性能与进展、AGI路径与实现时间、机器人革命、AI能源需求等话题。

Demis Hassabis表示,当前AI系统最大不足,在于缺乏真正创造性思维,要达成AGI目标,需等待1~2个根本性技术突破,有望未来5年内实现。谷歌正在Gemini基础上,研发机器人模型,旨在打造机器人的Android。

本期长期主义,选择Demis Hassabis深度专访,瓜哥AI新知发布,六合商业研选精校,分享给大家,Enjoy!

正文:

全文9,461字

预计阅读19分钟

DeepMind CEO Demis Hassabis All-in专访:离AGI还差1~2个根本性突破,有望5年内实现,正打造机器人的Android

时间:2025年9月13日

来源:瓜哥AI新知

字数:9,461

内容提要

AI未来与科学发现:AI,特别是AGI,将是加速科学发现、改善人类健康的终极工具,能够解决当前技术无法企及的难题。

诺贝尔奖与AlphaFold:Demis Hassabis因AlphaFold突破性成就,荣获诺贝尔奖,该项目展现AI在科学发现中巨大潜力。

Google DeepMind角色:Google DeepMind是Google与Alphabet的AI引擎室,负责开发与整合包括Gemini在内各类AI模型,并应用于Google众多产品与服务中,惠及数10亿用户。

Genie世界模型:Genie是新一代世界模型,能通过文本提示,即时生成可交互的3D环境,允许用户自由探索,展示AI理解物理世界的惊人能力。

AGI路径:构建能够理解物理世界的AI系统,是迈向AGI关键一步,这对机器人技术与智能设备发展至关重要。

机器人革命:AI将推动机器人领域巨大发展,未来可能出现类似Android的通用机器人平台。人形机器人能更好与人类环境互动而意义重大,专用形态机器人在特定任务中仍有价值。

AI创造力局限:目前AI在提出全新猜想、假设与原创概念方面仍有局限,缺乏人类科学家或艺术家直觉式、跨越式创造力。

AI模型性能与进展:有模型性能趋同说法,Google DeepMind并未感到性能提升放缓,仍在持续取得巨大进步,尤其是在模型效率与功能方面。

创意工具的民主化与增强:AI工具,如NanoBanana正在实现创造力民主化,极大降低创作门槛,它们也能成倍增强顶尖创意人士生产力。

共创式娱乐未来:AI将推动娱乐形式,向共创式发展。顶尖创作者负责设计引人入胜的体验与动态故事线,普通用户也能参与其中,共同创造。

药物发现加速:通过Isomorphic公司,AI正在革新药物发现流程,有望将研发周期,从数年,缩短至数周,甚至数天。

混合模型与确定性:AI模型正朝着混合模式发展,即结合基于数据的概率性学习与基于物理化学规则定性约束,提高效率与准确性。

AGI实现时间:Demis Hassabis预测,实现AGI可能还需5~10年,期间或许要经历1~2次重大突破。

AI能源需求与贡献:AI发展面临巨大能源挑战,它也将通过优化能源系统、设计新材料等方式,为解决气候变化问题做出巨大贡献,贡献将远超消耗。

10年后世界愿景:若能在10年内实现AGI,将开启科学与艺术的新黄金时代,为人类在能源、健康等领域,带来巨大福祉。

访谈全文

主持人:这是一位可能掌握我们未来钥匙的人,谷歌DeepMind CEO,是整个公司AI发展的驱动力。

在他凭借AlphaFold获得诺贝尔奖,并被查尔斯国王授予爵士头衔后,他已然成为AI领域先驱。

Demis Hassabis:我们是现代第一批认真投身于此的团队。我认为AlphaGo是重要的分水岭,不仅对DeepMind,对整个AI领域亦是如此,我从小就梦想用AI来加速科学发现。

主持人:祝贺你荣获诺贝尔奖,这要归功于AlphaFold非凡突破。

也许你已经分享过很多次了,我相信在座各位都想听你亲口讲述获奖那一刻的故事,你是如何得知的?

Demis Hassabis:那是非常超现实的时刻。他们通知你的方式,是在正式公布前10分钟。

你根本来不及消化这个消息,接到来自瑞典电话时,整个人是有点懵的,但那是每个科学家都梦寐以求的电话。

之后在瑞典参加为期一周的颁奖典礼,与皇室共处,一切都太棒了。

这项荣誉传承120年,最令人惊叹的环节是,他们会从保险库中,取出诺贝尔奖的签名簿。

你可以将你的名字,与历史上所有伟大的获奖者签在一起,那是真正不可思议的瞬间。

当你翻阅书页,会看到费曼、居里夫人、爱因斯坦、尼尔斯·玻尔,你可以一直往前翻。最后,你亲手将自己名字,写进那本历史名册。感觉,无与伦比。

主持人:你事先有预感自己被提名,或者觉得可能会获奖吗?

Demis Hassabis:会听到一些传闻,说实话,在今天这个信息时代,他们还能做到如此保密,实在令人惊讶,这类似是瑞典的国家宝藏一样被守护着。

你可能会听说,AlphaFold的成就,或许值得这份认可。

评选不仅看科学突破本身,也看它对现实世界影响,这种影响有时需20~30年才能完全显现。

你永远不知道它什么时候会来,甚至是否会来,这是惊喜。

主持人:几周前,我荣幸与你合了张影,那张照片我会永远珍藏。

我们来聊DeepMind在Alphabet中扮演的角色,Alphabet是庞大的组织,业务部门众多。DeepMind定位是什么,你负责哪些工作?

Demis Hassabis:几年前,我们将Google与Alphabet旗下AI团队,包括原来DeepMind进行整合,汇集各方优势,成立现在的Google DeepMind,我通常把它描述为整个Google与Alphabet的引擎室。

Gemini是我们正在构建的核心模型,我们还有许多其他模型,比如视频模型与交互式世界模型。我们正将这些模型,整合到Google各个角落。

现在,我们AI模型几乎内嵌于所有产品与业务领域。

数10亿用户正通过AI Overviews、AI模式,或Gemini应用与Gemini模型进行互动,这仅是开始,我们还在将其整合到Workspace、Gmail等产品中。

这为我们提供绝佳的机会,进行最前沿的研究,迅速部署给数10亿用户。

主持人:团队有多少人,他们背景构成是怎样的?

Demis Hassabis:在我部门Google DeepMind,大约有5,000人,超过80%是工程师与博士研究员,也是4千人左右。

主持人:模型在不断进化,新品类层出不穷。

前几天,你们发布Genie世界模型,它是什么?

我们这里正好有一段视频,不如我们边看边聊。

我觉得这个模型,必须亲眼看到,才能理解它的非凡之处。

我们可以播放视频,请Demis为我们介绍一下。

你看到的不是游戏,也不是视频,而是一个个世界,每一个都是由世界模型新前沿Genie生成的交互式环境。

借助Genie,你仅用一个文本提示,就能通过自然语言生成各种各样世界,并与之互动探索。

Demis Hassabis:你看到的这些交互式世界,全部是由文本提示生成,它允许用户实际控制画面。

这不是一段静态视频,用户可以用方向键与空格键,在3D环境中自由导航。

你在这里看到的一切,都是即时生成的。在你或者与你互动的玩家,移动到世界某个区域之前,那里的像素甚至不存在。

这创造了一种丰富的体验,每一次互动,都会带来全新视觉内容。

稍后你会看到,一切都是实时生成。这并非预先录制的视频,我们看到的是一个玩家正在粉刷房间,并在墙上添加图案。

玩家可以看向右边,再回头,体验环境的动态变化。

世界的这一部分,刚才还不存在,现在它被创造出来。

当玩家回头看时,还能看到自己刚刚留下的油漆痕迹。

同样,这里看到的每一个像素,都是完全由AI生成。

你还可以输入穿鸡服装的人、或者水上摩托艇之类的指令,模型会实时将它们融入场景中,这相当惊人。

主持人:我想,观众在看的时候,可能很难完全理解背后的技术飞跃。

我们都玩过带3D元素的视频游戏,沉浸在预设的世界里。

在这里,没有预先创建的物体,没有渲染引擎。

你们没有使用Unity或Unreal这样3D渲染引擎,这是AI实时生成,并渲染的一系列2D图像,完全即时创作。

Demis Hassabis:这个模型,正在逆向工程我们世界中的直观物理学。

它观看数百万YouTube视频、其他关于世界如何运作的影像资料,并仅仅从中就自己推导出世界许多运行规律。它不完美,已经可以生成1~2分钟的可交互内容,让用户在各种不同世界里操作。后面视频里,还可以控制沙滩上的狗、水母,或其他非人类角色。

主持人:传统3D渲染引擎,需程序员输入所有物理定律,比如光线如何从物体反射,创建一个3D模型,软件再根据这些规则,渲染出我们看到的视觉效果。

这个模型,仅通过观看视频,进行训练,就自己搞明白这一切。

Demis Hassabis:它结合视频与游戏引擎生成的合成数据进行训练,在此基础上,进行逆向工程。

这个项目对我个人意义非凡,极为震撼。

20世纪90年代,在我职业生涯早期,我是为视频游戏编写代码与AI,也开发过图形引擎。

我深知手工完成这些工作,有多么困难,编写多边形、构建物理引擎。

现在看到AI如此轻而易举处理这一切,真是太神奇了。水中光影反射、材质动态、物体行为方式,它几乎是开箱即用。

主持人:真的很难想象这个模型,背后解决多少复杂难题,实在是太震撼。

这会把我们引向何方,如果快进到它的第五代模型,会是怎样的场景?

Demis Hassabis:我们构建这类模型,是我们一直认为,我们在普通语言模型,比如我们Gemini模型上取得显著进展,我们从一开始就希望Gemini是多模态的。

我们希望它能够处理任何类型输入,如图像、音频、视频,并能生成任何类型内容。

我们对此非常感兴趣,我们认为,要实现真正AGI,系统必须理解我们周围物理世界,而非仅停留在语言或数学的抽象层面。

这对机器人技术至关重要,也恰恰是当前机器人技术所缺失的关键一环。

像智能眼镜助手这样设备,如果想在日常生活中帮助你,必须理解你所处的物理环境,世界直观的物理规律是如何运作的。

我们认为,构建Gemini这类模型、最先进的文生视频模型,正是我们打造世界模型的体现,一个能够理解世界动态与物理规律的模型。

如果你能生成这个世界,就证明你的系统理解背后的运行规律。

主持人:这最终将引向机器人领域,一个非常重要的应用。

目前在视觉、语言、动作模型的整合方面,最前沿的技术是怎样的?

换言之,一个通用的系统,它能观察世界,我可以通过语言,无论是文本还是语音,告诉它,我希望它做什么,它就能在物理世界中采取相应行动来完成任务。

Demis Hassabis:完全正确。

如果你试试我们Gemini Live,用手机对准周围世界,会惊奇发现它已经能够理解物理世界。

可以想象,下一步是将其集成到像智能眼镜这样更便捷设备中,让它成为你的日常助手。

当你在街上行走时,它就能为你提供建议,或者我们可以将其嵌入到谷歌地图中。

在机器人领域,我们构建Gemini机器人模型的系统,它们是在Gemini基础上,用额外机器人数据进行微调。

2024年夏天,我们发布了一些非常酷的演示。演示中,可以看到桌面上有两个机械臂与物体互动。

可以直接与机器人对话,比如下达把黄色物体放进红色桶里之类指令,它就会将语言指令转化为具体的运动指令。

多模态模型强大之处,在于它能将对现实世界的理解,融入人机交互中,远非专用的机器人模型所能及。

这最终将成为理想的用户界面UI/UX,也赋予机器人安全探索世界所必需的理解力。

主持人:我曾问过Sundar Pichai,这是否意味着你们最终可以构建类似Unix或Android的通用机器人平台?

届时,一旦这个平台在足够多设备上稳定运行,机器人硬件、公司与产品,会像雨后春笋般涌现,有了一个通用软件底层来支撑这一切。

Demis Hassabis:完全正确,这正是我们追求的策略之一,一个跨平台的机器人操作系统,类似打造机器人领域的Android。

另一条同样有趣的路径是垂直整合,即将我们最新的模型,与特定机器人形态进行端到端的深度融合与学习。

这两条策略都非常有趣,我们也在同时推进。

主持人:你认为人形是一个机器人形态吗,它在这个世界上实用吗?

有些人批评说,人形对什么都能做一点的人类很合适,对折叠衣物、洗碗或打扫房间这类特定任务,或许存在更优化的形态。

Demis Hassabis:我认为两者都会有各自用武之地。

5~10年前,我倾向认为我们会为特定任务开发专用的机器人形态。

在工业领域,比如实验室或生产线,情况肯定如此,会希望根据特定任务来优化机器人的形态。

对通用或个人用途的机器人,人形形态可能至关重要,它们需与我们世界互动。

我们物理世界,是围绕人类设计的,台阶、门廊、环境中许多其他方面,都是为我们量身打造。

与其改造整个世界来适应机器人,不如设计能无缝融入现有环境的机器人形态,这更容易。

我认为人形形态,对需要与我们日常环境互动的任务可能非常重要。

同时,我相信,为特定任务优化的专用机器人形态,同样会有一席之地。

主持人:对未来5~7年内,出现数百万、乃至上亿台机器人,你有什么看法,你脑海中有具体的愿景吗?

Demis Hassabis:我在这方面思考很久,我觉得我们现在仍处在机器人领域的黎明时分。

我预计未来几年内,机器人领域将迎来真正的惊艳时刻Wow moment。

算法仍需进一步发展,构建通用机器人模型,需做得更好、更可靠,对周围世界有更全面理解,我相信这种进步,将在未来几年内实现。

硬件方面,我相信最终将有数百万台机器人服务社会,并提高生产力。

关键问题是,我们何时才能拥有足以支撑规模化量产的硬件水平。

当你开始建造工厂,准备生产数万、或数十万台特定机器人时,快速迭代硬件设计,会变得极具挑战性。

这是挑战所在,如果过早将产品推向市场,6个月后,可能就会出现功能更强、更灵巧的下一代产品,让你陷入被动。

主持人:这个类比,听起来像是说,机器人领域,我们还处在个人电脑时代的20世纪70 年代,也是PC-DOS的阶段。

Demis Hassabis:或许我们处在那个阶段,不同的是,现在的发展速度,是1年顶过去10年。

主持人:1984年,可能是标志性年份。

我们来谈其他应用,尤其是在科学领域。

作为杰出的科学家,我一直认为,AI最伟大的成就,将是帮助我们解决凭借现有技术、能力,乃至人类智慧本身都无法攻克的难题。

在科学的哪些领域与突破上,你最为兴奋,为实现这些突破,又需什么样模型?

Demis Hassabis:用AI加速科学发现、改善人类健康,正是我投身于此的毕生追求,我认为这是我们能用AI做的最重要的事。

如果构建得当,AGI将成为科学探索的终极工具。

在DeepMind,我们已经展示这方面巨大潜力。

最著名的例子是AlphaFold,我们也已将AI系统,应用于材料设计、聚变反应堆的等离子体控制、天气预报,甚至解决奥林匹克数学竞赛难题等众多科学分支。

同一种类型的系统,经过微调,能应对许多复杂的挑战。

我相信,我们今天所见,仅是AI潜能的冰山一角。

当前AI存在一些局限性,我认为它不具备真正创造力,它无法提出全新的猜想或假设。

它可以验证你给出的命题,无法独立产生新的想法或理论。

我认为,这种创造新概念的能力,将是衡量AGI的标准之一。

主持人:这对未来意味着什么,人类创造力究竟是什么?

Demis Hassabis:我认为,创造力是我们在伟大科学家与艺术家身上所看到的直觉飞跃,这或许是通过类比推理实现的。

关于人类思维如何实现飞跃,心理学与神经科学中有很多理论。

一个很好的思想实验是,给一个AI限定1901年以前的知识,看它能否像爱因斯坦在1905年,独立提出狭义相对论。如果它能做到,我们就在通往AGI道路上,取得真正重要的进展。

另一个例子是我们AlphaGo,它击败围棋世界冠军。它不仅赢了,还开创围棋史上前所未有的新策略,比如著名的第37手。

问题依然存在,AI能否创造出一款像围棋一样优雅、精妙、富含美学的全新游戏,不仅是在现有规则下发明新策略?目前,这些问题的答案是否定的。

我认为离真正的AGI,缺失一个关键环节,创造并欣赏美的能力。

主持人:你能否更具体说明到底缺少什么?

几年前,Dario Amodei与Sam Altman等人,对AGI有不同看法,你是否不认同他们?

从你对系统架构的理解看,关键缺失环节是什么?

Demis Hassabis:我认为根本问题在于,我们能否复现顶尖科学家非线性、直觉式飞跃,而不仅是渐进式推理。

优秀科学家与伟大科学家区别在于,前者技术精湛,后者在此基础上更富创造力。

他们可能会从另一个学科领域发现某种模式,并将其类比应用到自己试图解决的问题上。

我相信AI有朝一日也能做到这一点,它目前不具备实现这种突破,所需的推理与思考能力。

我认为我们缺乏一致性。

你经常听到竞争对手,声称我们今天的系统拥有博士级智能,我认为纯属无稽之谈。

它们绝非博士级智能,它们或许在某些方面具备博士水准能力,缺乏通用性,真正通用智能,应该是在所有领域都达到博士水平。

我们都知道,与今天聊天机器人互动时,只要换个问法,它们甚至会在高中数学与简单计数上犯低级错误。

对真正的AGI系统,这种错误,是不应该发生的。

我认为,我们距离能做到这些的AGI系统,大约还有5~10年时间。

另一个缺失的能力,是持续学习,即时教系统新知识或调整其行为。

许多这类核心能力依然缺失,或许单靠规模化就能实现目标,如果要我下注,我认为还需一到两个根本性突破,这些突破可能会在未来5年内发生。

主持人:与此同时,一些报告与基准测试似乎显示出两点,一是大型语言模型性能正在趋同;二是每一代模型性能提升速度,似乎在放缓或趋于平稳。

这两个说法大体上准确吗?

Demis Hassabis:至少从我们内部看,并未发现这种情况,我们仍在见证巨大进步。

我们正在更广阔领域探索,可以看看我们Gemini模型与Veo模型。

主持人:NanoBanana简直太惊人,令人难以置信,它真的很棒。

我算是技术爱好者,从小玩Adobe Photoshop、Kai's Power Tools,我还跟你提过Bryce 3D。

当我看到如今的图形系统与它背后运行原理时,真的感到无比震撼。

Demis Hassabis:我认为这正是许多创意工具的未来,只需通过互动或对话下达指令,它就能精准、连贯完成任务。

NanoBanana为例,如此出色,是它是款顶尖的图像生成器,在同类产品中遥遥领先。它最核心优势之一,是生成结果的一致性。

它能根据指令精确修改你想要的细节,保持其余部分稳定不变。这样就可以不断迭代,直至达到理想效果。这恰恰揭示创意工具的未来图景,也预示行业发展方向,人们正乐在其中,享受用它创作的乐趣。

主持人:创造力的民主化,我认为这股力量非常强大。

我记得小时候,为学会怎么抠图、填充、羽化这些操作,我得买一本本厚厚的Adobe Photoshop指南,埋头苦读。

现在,任何人只要使用NanoBanana,直接说出自己想法,软件就能心领神会完成操作。

Demis Hassabis:我认为未来,会呈现两个趋势。

首先是这些工具民主化,让每个人都能轻松使用,进行创作,无需像过去,耗费大量精力学习复杂的软件界面与操作流程。

另一方面,我们在与顶尖电影制作人、创意人士、艺术家紧密合作。他们正在帮助我们共同设计新一代工具形态,告诉我们,他们真正需哪些功能。

比如我好友、杰出的导演达伦·阿伦诺夫斯基Darren Aronofsky,一直在用我们VEO与其他工具进行电影创作。通过观察他们,与他们合作,我们学到很多。

我们发现,这些工具同样能极大赋能顶尖的专业人士。

最顶级的创作者,他们创作效率,能够瞬间提升10倍、甚至100倍。

他们可以极低成本,将脑海中所有奇思妙想付诸实践,最终收获他们所期望的精美成果。

我认为这两个趋势,并行不悖。

我们既在推动工具民主化,让YouTube创作者等大众用户能使用;对顶尖创作,并非人人都能用这些工具达到同样高度。

这背后需要的是技巧,更重要的是顶尖创作者所具备的远见、叙事能力、独特的艺术风格。

我认为这些工具,只是让他们能够更快迭代自己想法,他们也对此乐此不疲。

主持人:我们最终会进入一个这样的世界吗,每个人都能随心所欲描述自己想要的内容。

比如我说,来一首Dave Matthews风格音乐,AI能即时创作一首全新的曲子?

或者,我想玩一款以《勇敢的心》为背景的电子游戏,主角是我自己,我就能亲身体验那段故事?

我们会发展到那一步吗,还是说,我们社会,需一种一对多的创作模式?

从文化层面看,我知道这有些哲学化,我非常好奇,我们是否还需由少数创作者打造、我们所有人共同分享的宏大叙事?

还是说,每个人都将沉浸自己塑造的个性化虚拟世界中?

Demis Hassabis:我预见到这样一个世界的到来,对此思考良多。

我最初是在20世纪90年代,以游戏设计师与程序员身份入行。

我相信,娱乐的未来,正在浮现,我们现在所见证的,或许正是一种包含共同创作元素的新艺术形态的萌芽。

我认为,顶尖的创意远见者,依然会是引人入胜的体验与动态故事线的主导者。即便他们与普通人使用相同工具,他们作品质量与深度,依然会更胜一筹。数百万人,或许会沉浸在这些世界里,同时,他们也能有机会参与到这些世界的共同创造中。

或许,顶尖创作者的角色,会转变为世界观的编辑,负责引导与整合众人的集体创造力。这些都是我预见在未来几年可能出现的演变,我非常渴望能亲自探索像Genie这样的技术,所带来的无限可能。

主持人:你目前如何分配你的时间,你还在Isomorphic工作吗?

或许可以请你介绍一下,Isomorphic是做什么的,你是否投入大量精力在那边?

Demis Hassabis:我仍在管理Isomorphic,这是我们一家衍生公司,致力革新药物发现,它建立在我们在AlphaFold蛋白质折叠预测的突破之上。

了解蛋白质结构,只是药物发现过程的第一步。

你可以把Isomorphic想象成,围绕AlphaFold构建一系列相关模型,用于解决后续问题,例如设计出能与蛋白质靶点精准结合、无副作用的化合物。

我认为,在未来10年内,我们有望将药物发现周期,从数年甚至10年,缩短到几周、乃至几天。

主持人:太不可思议了。

你认为这项技术会很快进入临床阶段,还是目前仍处于发现阶段?

Demis Hassabis:我们正在构建这个平台,与礼来Eli Lilly、诺华Novartis建立非常好的合作伙伴关系。

我们也有自己内部药物研发项目,我认为我们将在2026年某个时候进入临床前阶段。

主持人:候选药物会交给制药公司,由他们继续推进后续流程?

Demis Hassabis:是的,我们正在研究癌症、免疫学、肿瘤学等领域,与MD安德森癌症中心等顶尖机构进行合作。

主持人:我想回到你关于AGI观点上来,这与你刚才提到的内容息息相关。

如果我理解过于简化,请随时纠正我,模型可以分为概率性模型与确定性模型。

确定性模型,遵循固定的逻辑算法,每次输入,都会得到相同输出。

概率性模型,会根据可能性进行选择,比如选择这个词的概率是80%,那个词的概率是90%。

考虑到这种区别,当你进行药物发现建模时,有多少工作,是需开发与分子相互作用相关的、基于物理或化学原理定性模型?

具体来说,你在多大程度上关注构建这类新颖定性模型,来与基于数据训练的概率性模型并行工作?

Demis Hassabis:这是个非常问题。

目前、未来5年左右,我们正在构建的,可以称之为混合模型。

AlphaFold本身是一个混合模型,它有一个学习组件,也是你所说的概率组件,基于神经网络与Transformer等技术,能从你提供的任何可用数据中学习。

在生物学与化学领域,很多时候数据不充足。你必须将一些已知的化学与物理规则内置到模型中。

例如,AlphaFold中,我们需设定原子间的键角,确保模型理解原子不能重叠等基本物理约束。

理论上,模型可以自己学会这些,这会极大浪费模型的学习能力。将这些规则,作为约束条件直接加入,是更高效的做法。

无论是AlphaGo、还是其他混合系统,关键与难点,都在如何将学习系统与一个更偏向人工设计、定制化的系统完美结合,让它们协同工作,这相当有挑战性。

主持人:你认为这种架构,最终能否带来实现AGI所需的突破,是否有一些核心定性问题需我们攻克?

Demis Hassabis:我认为,最终目标是,当我们通过混合系统取得进展后,应将这些经验反哺,整合到学习组件中。

如果你能实现端到端学习,直接从原始数据预测出最终结果,那永远是更好的方案。

一旦你通过某个混合系统,取得突破,就会回过头尝试逆向工程,思考如何将这种新发现或新知识,融入到核心学习系统中。

这有点像我们对AlphaZero所做的改进,AlphaZero是AlphaGo一个更通用的版本。

AlphaGo内部包含一些针对围棋的特定知识,在AlphaZero中,我们移除这些定制规则,包括我们用来训练的人类棋谱数据,而是让它从零开始,通过自我对弈进行学习。

最终结果是,它不仅能下围棋,还能学会任何其他棋类游戏。

主持人:关于AI带来的能源需求,最近有很多讨论。

几周前在华盛顿特区的AI峰会上,这似乎是核心议题之一,也是当今科技界最热门的话题,这些电力将从何而来?

我想问你的是,模型的架构、硬件,或是模型与硬件的协同关系,是否会发生变革,显著降低每个输出token的能耗或成本,最终平缓我们眼前的能源需求曲线?

还是说,你认为,我们将不可避免看到一条呈指数级增长的能源需求曲线?

Demis Hassabis:我认为这两个趋势同时存在。

尤其是在谷歌与 DeepMind,我们一直非常注重开发兼具强大性能与高效率的模型。

这是我们有大量的内部应用场景,比如每天需为数10亿用户提供AI概览服务,这就要求模型必须具备极高效率、极低延迟、极低服务成本。

我们为此开创许多技术,比如蒸馏Distillation。

这个过程中,我们用一个更大的模型,来训练一个更小的模型,本质是让小模型模仿大模型的行为。

纵观过去2年发展,同等性能下,模型的效率,已经提升大约10倍,甚至100倍。

这并没有减少总体能源需求。原因在于,我们离AGI还有距离,前沿模型的研究,还在不断向前推进。

人们持续渴望以越来越大规模训练与实验新想法,这与服务端效率的不断提升,形成并行的局面。

最终,我相信从能源角度看,AI系统为解决能源与气候变化问题带来贡献,将远远超过自身的消耗。

这包括优化电网系统、设计具有新特性的材料,提升新能源的效率等。

我相信在未来10年,AI将在很大程度上帮助我们解决这些重大挑战,贡献将远超今天的能源消耗。

主持人:请你描绘10年后的世界。

Demis Hassabis:在AI领域,10年,甚至十周,都是一段相当长的时间,我无法确切预言10年后会发生什么。

我感觉,如果我们在未来10年内,成功实现AGI,将开启一个科学的全新黄金时代,一场新的文艺复兴。

届时,我们将看到从能源、到人类健康等各个领域都受益。

相关研报:

【长期主义】第337期环球说:富国岛行,与AI硬核对话的升维体验

国家经济、投资的范式变化:从碳基经济到硅基经济,AI寒武纪大爆发时刻

【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技

【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中

诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会

人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来

九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利

九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI

九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体

人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字

九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿

九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切

【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上

【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付

【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启

【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起

【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆

【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横

【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动

【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现

九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切

【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会

九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变

【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集

【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集

【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集

【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变

【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐

九宇资本赵宇杰:对智能电动汽车产业的碎片化思考

九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术

【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓

【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异

【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国

【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆

【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村

六合君3周岁生日,TOP 60篇经典研报重磅推荐

下午茶,互联网世界的三国杀

5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代

新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式

【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇

知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期

从APP Store畅销榜4年更替,看内容付费崛起

新三板破万思考:新三板日交易量10年100倍?

九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会

九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会

九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态|2016 GNEC 新经济新营销峰会

请务必阅读免责声明与风险提示