李飞飞最新访谈：从会说到会理解世界，世界模型开启AI一个十年

李飞飞，这位在人工智能领域深耕二十余年的科学家，被誉为“AI 教母”，至今依然活跃在技术变革的最前沿。

在她看来，人工智能并非“人工”创造的智能，而是根植于人类智慧、由人类塑造，并终将深刻影响每一个人的技术浪潮。如今，她的目光已投向一个比大语言模型更具前瞻性的新方向——世界模型。

近日，随着她所创立的 World Labs 发布全球首个大型世界模型产品 Marble，李飞飞深入回顾了AI跌宕起伏的发展历程，并展望了一个由“世界模型”所定义的未来。

从AI寒冬到黄金时代：一段不为人知的蜕变史

“在2015到2016年间，许多科技公司甚至刻意回避使用‘AI’这个词。”李飞飞在近期播客访谈中透露，“直到2017年前后，大家才开始自豪地宣称自己是‘AI公司’。”

短短九年，沧海桑田。

李飞飞的整个职业生涯几乎都投身于AI研究。她回忆道：“我内心深处感到欣慰的是，我青少年时期萌发的好奇心，如今已成为一股变革我们文明的力量。这是一种文明级别的技术。”

AI从被冷落到被热捧的转变，背后是长达七十年的艰辛探索。李飞飞强调，AI并非突然从石头里蹦出来的，而是一个有70年历史的领域，是几代人智慧的结晶。

“没有任何人能凭一己之力造就今天的一切。”

ImageNet：点燃AI革命的三要素之一

李飞飞领导的ImageNet项目常被视为深度学习革命的催化剂，但她谦逊地将其置于更广阔的技术演进中。

“现代人工智能有三大核心要素：大数据、神经网络和GPU。而ImageNet恰好成为了这三者的交汇点。”

2006年，李飞飞和她的团队启动ImageNet项目，从互联网上整理了1500万张图像，创建了一个包含22,000个概念的分类系统。当时他们敏锐地意识到，阻碍AI发展的关键瓶颈不是算法，而是数据。

“人类的学习和物种的进化，本质上是一个大数据的学习过程。”李飞飞解释道，“人类通过海量的、持续不断的经验来学习。”

2012年，多伦多大学的研究团队在杰夫·辛顿教授的带领下，利用ImageNet的大数据和两块GPU，参加了ImageNet挑战赛，实现了物体识别领域的巨大突破。

“那两块GPU就是人们去商店里买来玩游戏的那种。”李飞飞笑着说。

如今，驱动AI发展的GPU数量已达数十万块，性能也强大无数倍，但核心技术思路却一脉相承。

世界模型：AI 的下一场革命

当大众还在为ChatGPT的能力惊叹时，李飞飞早已将目光投向了更远的方向——世界模型。

“今天，你给一个模型看一段描述几个办公室的视频，让它数出里面有多少把椅子。这是蹒跚学步的幼儿都能做到的事，但如今的AI却做不到。”

李飞飞创立的World Labs正是专注于这一前沿领域。她解释道，世界模型能让任何人通过提示（无论是图像还是文字），创造出自己想象中的任何世界，并允许用户在所创造的世界中进行互动和推理。

“想象一个混乱的紧急救援现场，无论是火灾、车祸还是自然灾害。人们组织起来营救他人、控制灾情，大部分依靠的是行动，是对物体、世界和人类处境的本能理解。语言当然是一部分，但在很多情况下，语言并不能帮你扑灭大火。”

李飞飞认为，连接语言之外的智能、连接具身人工智能和视觉智能的关键，正是基于对世界理解的空间智能。

World Labs发布了全球首个大型世界模型产品——Marble。令人惊讶的是，它已经在多个领域展现出惊人潜力：

电影制作：与索尼合作，将虚拟制作时间缩短了40倍；

游戏开发：用户可以创建无限可探索的3D世界；

机器人训练：为机器人模拟创建合成环境；

心理学研究：研究心理疾病患者对不同特征的沉浸式环境的反应；

恐惧症治疗：为恐高症、蜘蛛恐惧症等提供暴露疗法场景。

机器人之路：为何“大数据法则”在此可能失效？

在讨论机器人技术的未来时，李飞飞提到了AI领域的“苦涩教训”——即那些利用海量数据和通用计算能力的简单模型，最终会战胜依赖人类精心设计的复杂模型。

但她认为，这一教训在机器人领域可能不再完全适用。

“机器人数据更难获取。”李飞飞指出，“语言模型之所以成功，部分原因是训练数据是词语，模型输出的也是词语，形成了一个完美的闭环。而机器人技术则不同，你希望机器人执行的是现实三维世界中的动作，但你的训练数据却缺乏这种动作数据。”

此外，机器人是物理实体，这意味着要让机器人真正运作起来，不仅需要“大脑”，还需要“身体”和应用场景。

李飞飞将机器人技术与自动驾驶汽车相比较：“自动驾驶汽车可以说是更简单的机器人；它们只是在二维平面上移动的金属盒子，目标是不触碰任何东西。而机器人是在三维世界中运行的三维物体，它们的目标恰恰是与物体进行交互。所以，这条路将是漫长而复杂的。”

技术越强大，越需要以人为本

面对AI可能取代人类工作的普遍担忧，李飞飞表现出坚定的乐观态度。

“每个人都能在人工智能的时代里找到自己的角色。”她在世界各地旅行时，总是告诉提问者，“任何技术都不应以剥夺人的尊严为代价。人的尊严与自主，必须是所有技术研发、部署和治理的核心。”

她举例说明：如果你是一位年轻的艺术家，你的热情在于讲述故事，那就把AI当作你的工具；如果你是一位临近退休的农民，你可以在社区中发挥影响力，在AI如何被使用和应用上拥有发言权；如果你是一名护士，AI可以为你赋能与支持，分担工作压力。

“我发现，身处硅谷的我们，有时倾向于闭门造车，而没有真正与硅谷之外的、广大的普通人进行心与心的交流。”李飞飞坦言，“我们热衷于抛出‘无限生产力’、‘无限闲暇’或‘无限赋能’这样的宏大叙事。但归根结底，人工智能是关于人的技术。”

给 AI 时代的每个人的建议

作为斯坦福“以人为本”人工智能研究院（HAI）的联合创始人，李飞飞一直在思考如何确保AI技术向有益于人类的方向发展。

她创立的HAI已经成为全球规模最大的，专注于以人为本的AI研究、教育、生态推广和政策影响的研究所，汇聚了斯坦福大学全部八个学院的数百名教员。

对于希望在AI时代找到自己位置的年轻人，李飞飞建议要“在求知上无所畏惧”。

“当你想要做出改变时，就意味着你必须去创造前所未有的事物，或深入无人涉足的领域。”她分享了自己的职业选择，“我不会去过度思虑所有可能出错的细节，因为那会让你寸步难行。”

她特别鼓励年轻人在做职业选择时，不要过度权衡利弊，而是要抓住真正重要的事情：你的热情究竟在哪里？你是否发自内心地认同这份事业的使命？你是否真正相信并愿意托付于这个团队？

结语：AI 的下一个十年，由 “人” 定义

从 ImageNet 点燃深度学习革命，到 Marble 开启空间智能新纪元，李飞飞的二十余年职业生涯，见证并塑造了 AI 的发展轨迹。她用行动证明，AI 的进步不仅需要技术的突破，更需要人文的坚守；不仅需要对科学的敬畏，更需要对人类的关怀。

当世界模型让 AI 开始理解物理世界，当空间智能让机器人逐渐走向实用，当 “以人为本” 成为 AI 治理的核心准则，我们有理由相信，AI 的下一个十年，将不再是单纯的技术竞赛，而是一场关于如何让技术更好服务人类的共同探索。

李飞飞曾说：“技术对人类的整体福祉是利大于弊的，因为我们本质上是一个懂得创造的物种。” 在 AI 时代，每个人都是创造者、参与者和受益者。无论是使用 Marble 释放创造力，还是在自己的岗位上借助 AI 提升价值，抑或是参与 AI 治理守护伦理底线，我们都在共同定义着 AI 的未来。

正如 Marble 所展示的那样，AI 可以创造无限可能的虚拟世界，但真正让这个世界有温度、有价值的，始终是人类的智慧、情感与坚守。李飞飞的故事告诉我们：AI 的终极目标，从来不是取代人类，而是让人类的潜能得到更大释放，让文明的进程走向更美好的未来。

DC娱乐网

李飞飞最新访谈：从会说到会理解世界，世界模型开启AI一个十年

热门分类