李飞飞,这位在人工智能领域深耕二十余年的科学家,被誉为“AI 教母”,至今依然活跃在技术变革的最前沿。
在她看来,人工智能并非“人工”创造的智能,而是根植于人类智慧、由人类塑造,并终将深刻影响每一个人的技术浪潮。如今,她的目光已投向一个比大语言模型更具前瞻性的新方向——世界模型。
近日,随着她所创立的 World Labs 发布全球首个大型世界模型产品 Marble,李飞飞深入回顾了AI跌宕起伏的发展历程,并展望了一个由“世界模型”所定义的未来。

“在2015到2016年间,许多科技公司甚至刻意回避使用‘AI’这个词。”李飞飞在近期播客访谈中透露,“直到2017年前后,大家才开始自豪地宣称自己是‘AI公司’。”
短短九年,沧海桑田。
李飞飞的整个职业生涯几乎都投身于AI研究。她回忆道:“我内心深处感到欣慰的是,我青少年时期萌发的好奇心,如今已成为一股变革我们文明的力量。这是一种文明级别的技术。”
AI从被冷落到被热捧的转变,背后是长达七十年的艰辛探索。李飞飞强调,AI并非突然从石头里蹦出来的,而是一个有70年历史的领域,是几代人智慧的结晶。
“没有任何人能凭一己之力造就今天的一切。”
ImageNet:点燃AI革命的三要素之一李飞飞领导的ImageNet项目常被视为深度学习革命的催化剂,但她谦逊地将其置于更广阔的技术演进中。
“现代人工智能有三大核心要素:大数据、神经网络和GPU。而ImageNet恰好成为了这三者的交汇点。”
2006年,李飞飞和她的团队启动ImageNet项目,从互联网上整理了1500万张图像,创建了一个包含22,000个概念的分类系统。当时他们敏锐地意识到,阻碍AI发展的关键瓶颈不是算法,而是数据。
“人类的学习和物种的进化,本质上是一个大数据的学习过程。”李飞飞解释道,“人类通过海量的、持续不断的经验来学习。”
2012年,多伦多大学的研究团队在杰夫·辛顿教授的带领下,利用ImageNet的大数据和两块GPU,参加了ImageNet挑战赛,实现了物体识别领域的巨大突破。
“那两块GPU就是人们去商店里买来玩游戏的那种。”李飞飞笑着说。
如今,驱动AI发展的GPU数量已达数十万块,性能也强大无数倍,但核心技术思路却一脉相承。
世界模型:AI 的下一场革命当大众还在为ChatGPT的能力惊叹时,李飞飞早已将目光投向了更远的方向——世界模型。
“今天,你给一个模型看一段描述几个办公室的视频,让它数出里面有多少把椅子。这是蹒跚学步的幼儿都能做到的事,但如今的AI却做不到。”
李飞飞创立的World Labs正是专注于这一前沿领域。她解释道,世界模型能让任何人通过提示(无论是图像还是文字),创造出自己想象中的任何世界,并允许用户在所创造的世界中进行互动和推理。
“想象一个混乱的紧急救援现场,无论是火灾、车祸还是自然灾害。人们组织起来营救他人、控制灾情,大部分依靠的是行动,是对物体、世界和人类处境的本能理解。语言当然是一部分,但在很多情况下,语言并不能帮你扑灭大火。”
李飞飞认为,连接语言之外的智能、连接具身人工智能和视觉智能的关键,正是基于对世界理解的空间智能。
World Labs发布了全球首个大型世界模型产品——Marble。令人惊讶的是,它已经在多个领域展现出惊人潜力:
电影制作:与索尼合作,将虚拟制作时间缩短了40倍;
游戏开发:用户可以创建无限可探索的3D世界;
机器人训练:为机器人模拟创建合成环境;
心理学研究:研究心理疾病患者对不同特征的沉浸式环境的反应;
恐惧症治疗:为恐高症、蜘蛛恐惧症等提供暴露疗法场景。
机器人之路:为何“大数据法则”在此可能失效?在讨论机器人技术的未来时,李飞飞提到了AI领域的“苦涩教训”——即那些利用海量数据和通用计算能力的简单模型,最终会战胜依赖人类精心设计的复杂模型。
但她认为,这一教训在机器人领域可能不再完全适用。
“机器人数据更难获取。”李飞飞指出,“语言模型之所以成功,部分原因是训练数据是词语,模型输出的也是词语,形成了一个完美的闭环。而机器人技术则不同,你希望机器人执行的是现实三维世界中的动作,但你的训练数据却缺乏这种动作数据。”
此外,机器人是物理实体,这意味着要让机器人真正运作起来,不仅需要“大脑”,还需要“身体”和应用场景。
李飞飞将机器人技术与自动驾驶汽车相比较:“自动驾驶汽车可以说是更简单的机器人;它们只是在二维平面上移动的金属盒子,目标是不触碰任何东西。而机器人是在三维世界中运行的三维物体,它们的目标恰恰是与物体进行交互。所以,这条路将是漫长而复杂的。”
技术越强大,越需要以人为本面对AI可能取代人类工作的普遍担忧,李飞飞表现出坚定的乐观态度。
“每个人都能在人工智能的时代里找到自己的角色。”她在世界各地旅行时,总是告诉提问者,“任何技术都不应以剥夺人的尊严为代价。人的尊严与自主,必须是所有技术研发、部署和治理的核心。”
她举例说明:如果你是一位年轻的艺术家,你的热情在于讲述故事,那就把AI当作你的工具;如果你是一位临近退休的农民,你可以在社区中发挥影响力,在AI如何被使用和应用上拥有发言权;如果你是一名护士,AI可以为你赋能与支持,分担工作压力。
“我发现,身处硅谷的我们,有时倾向于闭门造车,而没有真正与硅谷之外的、广大的普通人进行心与心的交流。”李飞飞坦言,“我们热衷于抛出‘无限生产力’、‘无限闲暇’或‘无限赋能’这样的宏大叙事。但归根结底,人工智能是关于人的技术。”
给 AI 时代的每个人的建议作为斯坦福“以人为本”人工智能研究院(HAI)的联合创始人,李飞飞一直在思考如何确保AI技术向有益于人类的方向发展。
她创立的HAI已经成为全球规模最大的,专注于以人为本的AI研究、教育、生态推广和政策影响的研究所,汇聚了斯坦福大学全部八个学院的数百名教员。
对于希望在AI时代找到自己位置的年轻人,李飞飞建议要“在求知上无所畏惧”。
“当你想要做出改变时,就意味着你必须去创造前所未有的事物,或深入无人涉足的领域。”她分享了自己的职业选择,“我不会去过度思虑所有可能出错的细节,因为那会让你寸步难行。”
她特别鼓励年轻人在做职业选择时,不要过度权衡利弊,而是要抓住真正重要的事情:你的热情究竟在哪里?你是否发自内心地认同这份事业的使命?你是否真正相信并愿意托付于这个团队?
结语:AI 的下一个十年,由 “人” 定义从 ImageNet 点燃深度学习革命,到 Marble 开启空间智能新纪元,李飞飞的二十余年职业生涯,见证并塑造了 AI 的发展轨迹。她用行动证明,AI 的进步不仅需要技术的突破,更需要人文的坚守;不仅需要对科学的敬畏,更需要对人类的关怀。
当世界模型让 AI 开始理解物理世界,当空间智能让机器人逐渐走向实用,当 “以人为本” 成为 AI 治理的核心准则,我们有理由相信,AI 的下一个十年,将不再是单纯的技术竞赛,而是一场关于如何让技术更好服务人类的共同探索。
李飞飞曾说:“技术对人类的整体福祉是利大于弊的,因为我们本质上是一个懂得创造的物种。” 在 AI 时代,每个人都是创造者、参与者和受益者。无论是使用 Marble 释放创造力,还是在自己的岗位上借助 AI 提升价值,抑或是参与 AI 治理守护伦理底线,我们都在共同定义着 AI 的未来。
正如 Marble 所展示的那样,AI 可以创造无限可能的虚拟世界,但真正让这个世界有温度、有价值的,始终是人类的智慧、情感与坚守。李飞飞的故事告诉我们:AI 的终极目标,从来不是取代人类,而是让人类的潜能得到更大释放,让文明的进程走向更美好的未来。