【长期主义】第245期智能说:吴恩达演讲,李飞飞与吴恩达对话

科技有六合 2024-03-06 01:33:57

2023年7月底,吴恩达Andrew Ng在斯坦福大学做的讲座AI里的机遇Opportunities in AI,30分钟里,信息密度高,覆盖如下这些主题:AI技术与工具发展趋势,监督学习,生成式AI,AI的采用,AI中的机遇,建立创业公司的过程,AI风险与社会影响。

2023年5月中旬,AI领域两位知名学者李飞飞与吴恩达在斯坦福大学进行一次对话,深入探讨AI边界与未来前景,分享对智能问题的独特见解与前瞻性思考。

本期“长期主义”,选择吴恩达在斯坦福大学演讲、李飞飞与吴恩达在斯坦福大学对话,Web3天空之城、有新Newin发布,六合商业研选精校,分享给大家,Enjoy!

正文:

全文15,759字

预计阅读32分钟

吴恩达:AI里的机遇

时间:2023年9月11日

来源:Web3天空之城

字数:8,640

2023年7月底,吴恩达Andrew Ng在斯坦福大学做的讲座AI里的机遇Opportunities in AI,30分钟里,信息密度高,覆盖如下这些主题:AI技术与工具发展趋势,监督学习,生成式AI,AI的采用,AI中的机遇,建立创业公司的过程,AI风险与社会影响。

主持人 Lisa:非常荣幸今晚欢迎吴恩达博士。吴恩达是AI基金执行总合伙人,深度学习AI与着陆AI创始人,Coursera董事长与联合创始人,斯坦福大学计算机科学兼职教授。此前,他创建并领导谷歌大脑团队,这帮谷歌采用了现代AI,也曾是斯坦福AI实验室主任。约有800万人,每1,000人中就有1人,从他那里上过AI课程。通过他的教学与AI工作,他改变了许多人的生活。让我们欢迎吴恩达博士。

吴恩达:我今天想要做的就是与你们聊聊AI中一些机遇,我一直说AI是新电力。理解AI难点之一是,它是通用技术,意味着它不仅对一件事有用,而是对许多不同应用都有用,像电一样。如果我问你,电有什么用?你知道,它不仅对一件事有用,而是对许多事有用。

我想首先与你们分享我如何看待技术格局,这将引出一系列机遇。

关于AI有很多炒作,很多兴奋。

我认为思考AI的一个好方法是把它看作一套工具。这包括叫监督学习的技术,它非常善于识别或标注事物,还有相对较新的激动人心的发展,生成式AI。如果你熟悉AI,你可能听说过其他工具,但我今天会少谈这些额外的工具,我将重点谈论我认为目前最重要的两个工具,监督学习与生成式AI。

监督学习非常擅长标注事物,或说非常擅长计算输入到输出,或从A到B的映射。给我一个输入A,给我一个输出B。例如,给定一封电子邮件,我们可使用监督学习来将其标注为垃圾邮件或非垃圾邮件。我工作过的这个技术中最具价值的应用可能是在线广告,在这里,给定一个广告,我们可标注一个用户是否可能点击它,从而展示更相关的广告。

对自动驾驶汽车,给定汽车传感器读数,我们可标注其他汽车位置。我在AI基金的团队做过的一个项目是船舶路线优化,给定一艘船正在采取或考虑采取的路线,我们可标注我们认为它将消耗多少燃料,并用这来使船舶更省油。

它在工厂自动视觉检查中做了大量工作。你可拍一张刚制造的智能手机图片,并标注是否有划痕或其他缺陷。或如果你想建立一个餐厅点评声誉监测系统,你可让一个小软件检查在线餐厅点评并将其标注为积极或消极情绪。

监督学习一个很好的地方,一个很酷的地方是,它不仅对一件事有用,而是对所有这些不同应用都有用,还有更多。让我具体跟你们走一遍监督学习标注事物这类项目的一个示例的工作流程。

如果你想建立一个对餐厅点评进行标注的系统,你会收集一些数据点或数据集,比如说,帕斯特拉米三明治非常好,你会说这是积极的。服务很慢,这是消极的。我最喜欢的鸡咖喱,这是积极的。在这里我展示了三个数据点,但在构建这个系统时,你可能会得到成千上万这样的数据点,我们称之为训练样本。

一个机器学习项目,一个AI项目的工作流程,是你获得标注过的数据,可能是成千上万的数据点。然后,你会有AI工程团队,训练AI模型来从这些数据中学习。最后,你会找到可能是云服务来运行训练好的AI模型。

我认为过去10年可能是大规模监督学习的10年。我们大约在10~15年前发现,如果你训练小的AI模型,也就是训练小的神经网络或小的深度学习算法,小的AI模型,可能不在一个非常强大的计算机上,当你提供越来越多数据时,它的表现会稍微变好,但随后会趋于平缓,会达到平台期,它会停止能利用数据变得越来越好。

但如果你训练非常大的AI模型,在可能很强大的GPU上用大量计算资源,当我们扩大给机器学习模型的数据量时,它的表现会持续变得越来越好。

这就是为什么当我开始并领导谷歌大脑团队时,我指导团队当时要解决的主要任务就是构建非常、非常大的神经网络,我们向其提供大量数据。幸运的是,这个方法行之有效。我认为推动大规模计算与大规模数据,这些方法真的帮我们在过去10年取得很多AI进步。

如果说上个10年是AI的10年,我认为这个10年仍在做我们在监督学习中做的一切,但增加了生成式AI等令人激动的新工具。你们许多人可能都玩过ChatGPT等。

你知道,给出一段文本,你称之为提示,比如我喜欢吃什么东西。如果你多次运行它,你可能得到百吉饼、奶油乳酪,或我妈妈的肉饼,AI系统可生成这样的输出。

鉴于对生成式AI的大量关注与兴奋,我想花半张幻灯片的篇幅,简单介绍一下它是如何工作的。

事实证明,生成式AI,至少这种文本生成类型,核心是使用监督学习中的输入输出映射,重复预测下一个词。如果你的系统在网上读到这样一句话:我最喜欢的食物是奶酪夹心百吉饼,然后,这被转化成几个数据点,如果它看到我最喜欢的食物是,在这种情况下,试图猜测正确的下一个词是百吉饼,或我最喜欢的食物是百吉饼,试图猜测下一个词,类似,如果它看到在这种情况下,下一个词的正确猜测应是奶酪。

通过获取你在网上或其他来源找到的文本,并使用这样的输入输出,监督学习来尝试重复预测下一个词,如果你在数以百亿计的词上训练一个非常大的AI系统,或在现在最大模型中,超过1万亿个词,然后你得到像GPT这样的大型语言模型。

还有其他一些重要的技术细节。我谈到预测下一个词。从技术上讲,这些系统预测的不是词,而是一个叫词元token的词的一部分。还有一些其他技术,像微调输出使其更有用,更诚实,更无害。但核心是使用监督学习来重复预测下一个词元token,这才真正启用了在大型语言模型方面激动人心的进步。

尽管许多人将大型语言模型视为极好的消费者工具,你可去GPT、Bard或其他大型语言模型网站使用它作为极好工具。

我认为还有一个趋势仍被低估,那就是大型语言模型的力量,不仅作为消费者工具,也作为开发者工具。事实证明,过去需我花数月才能构建的应用,现在很多人可通过使用大型语言模型来更快构建。

具体而言,构建餐厅评论系统等监督学习的工作流程,将是你需获取大量标注数据,这可能需1个月来获取几千个数据点。然后让AI团队训练、调优并真正获得你AI模型的优化性能,这可能需3个月。然后找到云服务来运行它,确保它稳定运行,确保它被识别,这可能再需3个月。构建商业级机器学习系统的现实时间表大概是6~12个月。

我领导的团队通常需大约6~12个月来构建与部署这些系统,其中一些被证明非常有价值,但这就是构建与部署商业级AI系统的现实时间表。

相比之下,基于提示的AI,你只需编写提示,工作流程如下所示。你可编写一个需几分钟或几小时的提示。然后把它部署到云上,这可能需几小时或几天。现在有一些AI应用,过去需我花6个月甚至1年来构建,现在全球许多团队可在1周内构建。我认为这已开始,但最好的还在后头。这正在打开大量更多AI应用的大门,可被许多人构建。

我认为很多人仍低估我认为将要出现的大量定制AI应用的规模。现在,我知道你们可能没想到我在这个演示中写代码,但我就是要这么做。事实证明,这就是我构建一个情感分类器所需的全部代码。

我会导入一些来自OpenAI的工具,我猜一些人会知道Python。然后我有这样一个提示,它说对以下文字进行分类,delimited by three dashes,判断其情感是积极还是消极。“哦不,我在斯坦福商学院度过了美好时光,学到了很多,也交了很多新朋友”。

好的,这就是我的提示。现在我只要运行它。我从没运行过,我真的希望结果正确。太好了,我们得到正确的答案。

这字面上就是构建一个情感分类器所需的全部代码。今天,世界各地开发者可能只需大约10分钟就可构建这样系统,我认为这是非常激动人心的发展。

我一直在做的工作之一是,尝试教授在线课程,关于如何使用提示,不仅作为消费者工具,也作为开发者工具。关于技术格局,让我现在分享我对AI机遇的一些看法。

这显示了我认为不同AI技术目前的价值,我会谈3年后的情况。但今天AI绝大部分价值来自我认为的监督学习,对单个公司如谷歌每年价值可能超过1,000亿美元。而且还有数百万开发者构建监督学习应用。它已非常有价值,并且由于大量努力找到应用与构建应用,后劲也很足。

生成式AI是真正令人激动的新兴技术,目前还很小。然后为完整性,我也包含了其他工具。如果这些圆圈代表今天的价值,这就是我认为3年后的发展。

监督学习已非常大,可能在未来3年加倍,从已非常大变得更大。生成式AI,今天还很小,但我认为在未来,3年会增长2倍以上,由于开发者兴趣、风险投资投资以及大公司探索应用。我也想指出,3年是非常短的时间段。如果增长速度保持,6年后会更加巨大。

但这个绿色或橙色区域,那个浅色区域,是新的创业公司或大公司可创造与获得价值的空间。我希望你从这个幻灯片获得的信息是,所有这些技术都是通用技术。

对监督学习,过去10年所做的大量工作,及未来10年将继续做的,是识别与执行具体的用例。这对生成式AI也正在开始。

我希望你从这个部分获得的信息是,通用技术对许多不同任务都有用。使用监督学习还有很多价值等待创造。尽管我们远未弄清监督学习所有的激动人心的用例,我们有这个新工具生成式AI,这进一步扩大我们可用AI做的事。

但需注意,在这个过程中会有短期热潮。

我不知道你们中是否有人还记得Lensa应用,这款应用,可让你上传自己照片,它们会把你渲染成酷酷的宇航员或科学家形象。这是不错的创意,人们喜欢它。它大致在2022年12月疯狂流行,然后就下滑。Lensa是好的创意,人们喜欢它。但它仅是建立在其他人非常强大API之上的相对薄弱的软件层。

尽管它是有用的产品,但业务上不可防守。当我思考类似Lensa应用时,它让我想起乔布斯给我们iPhone。不久后,有人写了一个应用,我花1.99美元买了它,打开LED灯,把手机变成手电筒。这也是不错的创意,写一个打开LED灯的应用。但从长远看,它也不是可防守的业务,也没创造持久价值,它很容易被复制与低价替代,最终被整合进iOS。

但随iOS与iPhone兴起,有人也想出如何构建Uber、Airbnb、Tinder等非常长期、可防守的业务,创造持续价值。我认为随生成式AI或新AI工具兴起,真正令我激动的是创造非常深入、非常难应用的机会,希望它们可创造长期价值。

我想分享的第一个趋势是,AI是通用技术,我们面前存在大量工作,那就是找到各种各样使用案例并构建它们。

我想分享的第二个趋势,与AI为何还未被更广泛采用有关。

感觉我们好几个人谈AI已15年,但如果你看AI价值目前分布,大部分仍高度集中在消费软件与互联网界。一旦走出科技或消费软件互联网领域,有一些AI采用,但很多还处于早期。

为什么会这样?事实证明,如果你把所有当前与潜在AI项目排序,价值由高到低,这条曲线左边头部是10亿美元级别的项目,比如广告、网络搜索,或电商产品推荐,或像亚马逊这样的公司。

事实证明,约10~15年前,我与一些朋友想出一个办法,雇佣100名工程师来编写一段软件,提供更相关的广告,将这一软件应用到10亿用户,产生巨大财务价值。这是可行的。

但一旦你走出消费软件与互联网领域,几乎没人拥有1亿或10亿用户,可对他们应用一段软件。一旦进入其他行业,当我们从这条曲线左边头部进入长尾部时,我看到一些令我激动的项目。

我与一家比萨饼制造商合作,他们拍比萨饼照片,他们需做一些确保奶酪铺展均匀的事。这是约500万美元的项目,但聘请数十名高技能工程师来做500万美元项目的老办法行不通。

或作为另一个例子,我与一家农业公司合作,我们意识到如果用摄像头检测小麦高度,小麦经常因风雨倒伏,我们可在合适高度割下小麦,这会让农民有更多食物可卖,对环境也更好。

但这又是500万美元的项目,老办法是雇佣大批高技能工程师做这个项目也行不通。类似,材料分级、布分级、钢板分级,还有许多这样的项目。

在这条曲线左边头部,有少数10亿美元级别项目,我们知道如何执行这些项目创造价值。但在其他行业,我看到有成千上万个5,000万美元级别项目的长尾,到现在由于高昂定制成本很难执行。

我认为激动人心的趋势是,AI社区一直在建立更好工具,让我们聚合这些用例,并让终端用户轻松定制。

具体而言,我看到许多令人兴奋的低代码与无代码工具,它让用户定制AI系统。这意味着,我不必太担心比萨饼图片,我们有工具,正在见到可让比萨饼工厂的IT部门用自己比萨饼图片训练AI系统,实现500万美元价值。

顺便说一下,比萨饼图片不存在互联网,谷歌与Bing无法获得这些图片。我们需要的工具是真正可被比萨饼工厂自己使用、构建、部署与维护适用于自己比萨饼图片的定制AI系统。

广义地,实现这一点的技术包括提示、文本提示、视觉提示,或大型语言模型与类似工具,或叫做数据中心AI的技术,我们不要求比萨饼工厂编写大量代码,这很有挑战性,而是要求他们提供数据,这更可行。

我认为第二个趋势很重要,我认为这是将AI价值从目前仍高度集中在科技界与消费软件互联网界,推广到所有行业与更大经济体的关键部分。有时很容易忘记,除科技界之外其他经济体规模其实更大。

我分享的两个趋势是,AI作为通用技术,存在大量具体用例有待实现,以及低代码、无代码、易用工具,使AI能应用到更多行业。

我们该如何抓住这些机遇?

大约5年前,我想解决一个难题,那时我觉得现在许多有价值的AI项目都是可能的。我在思考,我们如何完成这些项目?

在谷歌与百度等大公司领导AI团队后,我很难想出在大科技公司里操作一个团队去追求各种各样机遇,从航运到教育再到金融服务、医疗保健等。

场景非常多样化,进入市场非常多样化,真正的客户基础与应用也非常多样化。我觉得最有效的方法是,如果我们可启动许多不同公司来追求这些非常多样化的机会。

这就是为什么我最终创立AI基金,这是孵化创业公司的创业工作室,以追求各种各样机会。当然,除许多创业公司,现有公司也有大量机会将AI整合到现有业务中。事实上,我看到的一种模式是,对现有公司来说,分销通常是现有公司的周期性优势之一,如果他们玩好牌,可让他们非常有效的将AI整合到产品中。

具体而言,机会在哪里?我把它看作是一个AI栈。底层是硬件半导体层,这里有巨大机会,但资本密集,高度集中。有很多资源,但获胜者相对较少,有些人可以用并且应在这里发展,我个人不喜欢在这里发展。

还有基础设施层。同样,巨大机会,但资本密集,高度集中,我也倾向不在这里发展。

然后是开发者工具层。我刚才展示的就是我实际上正在使用OpenAI的API作为开发者工具,我认为开发者工具领域竞争激烈。看所有在追逐OpenAI的创业公司,但会有一些大赢家。我有时在这里发展,但主要是当我认为有重大技术优势时,我认为这为你赢得成为大赢家的权利或机会。

最后,尽管媒体关注与热点集中在基础设施与开发者工具层,但事实证明,只有当应用层更成功时,那一层才能成功。

我们在SaaS兴起中也看到这一点。很多关注与兴奋,集中在技术与工具层,这很好,没什么问题。但它成功的唯一途径是应用层更成功,实际上它们可产生足够收入来支付基础设施与工具层。

实际上,我举一个例子。Armoury,我昨天刚给CEO发短信。Armoury是我们创建的使用AI进行恋爱关系指导的公司。我是AI人,我觉得我对浪漫一无所知。如果你不相信我,可问我妻子,她会确认我对浪漫一无所知。但我们想建立这个,我们想与Tinder前CEO Renata Naibog合作,利用我团队的AI专长与她的恋爱关系专长,我们能建立一些独特的东西,使用AI进行某种程度的恋爱关系指导。

这样的应用程序有趣之处在于,当我们环顾四周时,全球有多少团队同时拥有AI与恋爱关系的专业知识?

在应用层面,我看到许多激动人心的机会,似乎拥有非常大的市场,但相对机会的规模,竞争者很少。这并不是说没竞争对手,但与开发者工具或基础设施层相比,竞争明显少得多。

我花了很多时间在构建创业公司的过程上迭代,我将透明的告诉你,我们开发的创业公司构建配方。经过多年考虑与改进后,这就是我们现在构建创业公司的方式。

我的团队总是接触到许多不同想法,来自合作伙伴内部生成的想法。我想以我们做的一件事为例阐述这个过程,那就是Bering AI公司,它使用AI使船舶更加节油。这个想法来自几年前,一个大型日本财团三井,它是某种程度上运营大型航运公司的主要股东。他们来找我,说,吴恩达,你应建立一个业务,使用AI使船舶更节油。

具体想法是,可把它看作是船舶版谷歌地图,我们可对船舶提供建议或指示,以按时到达目的地,但使用10%更少的燃料。

我们现在所做的是花大约1个月时间验证这个想法,仔细检查这个想法在技术上是否可行,然后与潜在客户交谈,确保有市场需求。我们花大约1个月的时间来做这些。如果它通过这个阶段,我们就会招募一位CEO与我们合作这个项目。

刚开始时,我会在带上CEO之前,自己工作这个项目很长时间。通过迭代,我们意识到从一开始就带上领导与我们合作,可减少很多知识转移的负担,或CEO进来后需重新验证我们发现的东西。我们发现这个流程可更有效,我们会从一开始就带上领导。

对Bering AI,我们找到优秀的CEO Dylan Kyle,他是连续创业者,之前有过一次成功。然后我们花3个月,6个2周冲刺与他们合作构建原型与进行深入的客户验证。

如果它通过这个阶段,我们有大约66%的存活率,我们会进行第一个融资,这为公司提供资源来聘请管理团队、建立关键团队、使MVP最小可行产品工作,并获得一些真实客户。之后,希望它可成功融资额外的外部资金轮,我们可继续增长与扩张。

我为我团队能支持三井想法,与Dylan Kyle作为CEO感到非常自豪。今天,现在就有数百艘船在公海上以不同方式航行,有了Bering AI,10%的燃油节省转换到大概每艘船每年45万美元的燃料节省。当然,坦率说,这对环境也更好。

我认为如果没Dylan出色工作,这个创业公司不会存在。还有,三井把这个想法带给我。我喜欢这个例子,这是一个创业的想法,我只想指出,这绝不是我自己会想到的。是三井的专业知识产生这个见解,与Dylan以及我团队的AI专业知识配合,才使这成为可能。

在AI领域工作,我学到的一件事是,我的领域是AI,仅此而已,我没时间,要成为海运、恋爱关系、医疗保健、金融服务等所有领域专家,对我来说非常困难。我学到如果我只能提供准确的技术验证,然后利用AI资源快速而出色构建AI技术,我认为我们一直能帮公司建立强大的技术团队,与主题专家合作,往往会带来激动人心的新机会。

我想与你分享关于建立创业公司另一个奇怪的经验教训,那就是我只喜欢在有具体想法时参与。这与你从设计思维方法中听到的许多建议相反,它通常说,不要急于找到解决方案,探索许多替代方案,避免解决方案。

说实话,我们试过,进展很慢。我们学到的是,在构想阶段,如果有人对我说,吴恩达,你应把AI应用到金融服务,我不是金融服务专家,我去学习足够的金融服务知识非常缓慢。我意思是,最终你可能会有好的结果。但这对我来说,是非常劳动密集型、缓慢、昂贵的过程,去逐一学习不同的行业。

相比之下,我的合作伙伴提出具体想法,买下GPT,通过自动购买每一个广告中的产品来消除商业广告,以此换取不看广告。这可能不是好主意,但它是具体的想法。事实证明,具体的想法,可有效进行验证或证伪,它们也为团队提供明确执行方向。

我发现当今世界,由于许多人对AI兴奋、关注、接触,现在有许多主题专家已对一个问题思考几个月甚至一两年,但还没技术实现伙伴。

当我们与他们团队,他们与我们分享想法时,这允许我们与他们合作很快进行验证与构建。我发现这种方法行之有效,是已有许多人做了探索许多想法,并归纳出真正好想法的设计思考,存在这样许多没人处理的好想法,找到别人已有的想法并与我们分享、寻求技术伙伴,这被证明是更有效的引擎。

在我们进入问题环节之前,我想用几张幻灯片讨论风险与社会影响。

AI是非常强大的技术。我想明确的是,我与团队只从事推动人类进步的项目。我们多次伦理理由否决了在财务上合理的项目。事实证明,我对人们设计真正不应建造但看似盈利的坏主意的创造力感到惊讶与失望。

我们因此否决了几个项目。然后,我认为必须承认,AI今天在偏见、公平性、准确性方面确实存在问题,但技术也在快速改进。我看到,相比6个月前,AI系统今天偏见更少,更加公平。这不是轻视这些问题的重要性。它们确实存在,我们应继续努力。但我也对许多AI团队努力解决这些问题感到欣慰。

当我思考AI最大风险时,我认为最大风险之一是对就业冲击。这是我在宾夕法尼亚大学一个朋友与OpenAI一些人撰写的一篇论文中的图表,分析不同工作对AI自动化的敞口。

尽管之前的自动化浪潮主要影响较低工资工作,如当我们在工厂使用机器人时,但这波自动化浪潮影响的实际上似乎是这条坐标轴右侧的较高工资工作,它们更多任务面临AI自动化。即使我们利用AI创造巨大价值,作为公民与公司、政府与整个社会,我觉得我们有强烈义务确保那些生计被冲击的人仍能获得很好的照顾与对待。

最后,我觉得每次AI取得重大进展,就会出现一波关于通用AI的炒作。当10年前深度学习开始工作得很好时就出现一波,现在通用AI工作得很好又出现一波。

但我认为通用AI要实现人类所有能力,还需几十年,可能30~50年,甚至更长。我希望我们有生之年能看到,但我认为不会很快实现。

一个挑战是,人类与AI走向智能的生物路径与数字路径非常不同。关于通用AI的定义基准是非常不同的数字智能路径与生物智能路径,这很有趣。我认为大型语言模型在某些关键维度上比任何人都更智能,但在其他维度上远不如人。强迫它做人能做的任何事,是一种奇怪的比较。但我希望我们能实现它,也许在我们有生之年。

我也认为关于AI给人类带来灭绝风险的说法过于夸大。坦白说,我不这么看。我不认为AI给人类带来任何重大的灭绝风险。我认为人们担心我们无法控制AI,但我们在控制像公司或国家这样更强大的实体方面有丰富经验,确保它们在很大程度上惠及人类。技术也在逐步发展,所谓的硬起飞场景也不现实。

我认为如果要使人类在未来1千年存活与繁荣,与其降低AI速度,不如使AI尽可能快。

总结一下,我认为AI作为一项通用技术,为每个人创造许多新机遇。我们所有人面前激动人心与重要的工作,就是去实现这些具体用例。

李飞飞x吴恩达斯坦福对谈,从寻找北极星到AI for All,谁将改变世界

时间:2023年5月30日

来源:有新Newin

字数:7,116

2023年5月中旬,AI领域两位知名学者李飞飞与吴恩达在斯坦福大学进行一次对话,深入探讨AI边界与未来前景,分享对智能问题的独特见解与前瞻性思考。

李飞飞是斯坦福大学计算机科学系杰出教授,也是斯坦福AI研究所创始人之一;她在AI领域有着广泛影响力,尤其在计算机视觉与机器学习方面。

吴恩达是AI领域知名学者,曾在斯坦福大学担任教授,并创建在线机器学习平台Coursera,也是深度学习与神经网络领域先驱之一,致力推动AI发展与应用。

从物理学横跨到AI领域

吴恩达:很高兴今天能与大家一起,这是我老朋友李飞飞,斯坦福大学计算机科学教授,也是HAI联合主任,还曾担任谷歌云AI首席科学家,负责该部门AI事务。

李飞飞:谢谢,Andrew,很高兴能在这里。

吴恩达:我们认识多久了,我都忘记了。

李飞飞:肯定超过10年,我来到斯坦福是2009年,但我们在2007年就开始交流,已15年。

吴恩达:我仍清楚记得当我们一起努力招募你来斯坦福时,那时压力有多大,我与Chris Manning 等人一起努力想方设法说服你来斯坦福。

李飞飞:其实并不难,我只需安排好我学生与生活,但是很难拒绝斯坦福。

吴恩达:你在这里对我来说真的太好了,既是朋友,又是同事。

李飞飞:我也很高兴能长时间与你交谈,我们非常幸运能成为见证AI取得巨大进展的一代人。

吴恩达:你的背景,我一直觉得很鼓舞人心的地方。如今,人们从各行各业进入AI领域,有时人们仍会疑惑,我主修某个专业,AI对我来说是正确的道路吗?我认为你背景中最有趣一部分是,你实际上最开始并没学习计算机科学或AI,你最开始是学物理,然后才成为全球公认的AI科学家之一,你是如何从物理学转向AI的?

李飞飞:这是好问题,Andrew,尤其是我们都对年轻人未来充满热情,他们进入AI的世界。事实上,如果我能在20多年前进入AI领域,如今任何人都可进入AI,AI已成为一项普遍而具有全球影响力的技术

我自己可能是一个意外,我一直是物理学的孩子或STEM孩子,相信你也是,但物理学一直是我热情所在,从中学到高中、大学,我去了普林斯顿大学,主修物理学。

物理学教会我重要的东西,就是对提出重大问题的热情,对寻找北极星的热情。在普林斯顿时,我非常享受作为物理学生的乐趣,我做的一件事就是阅读20世纪伟大物理学家的故事与著作,听他们对世界看法,特别是像阿尔伯特·爱因斯坦、罗杰·彭罗斯、欧文·薛定谔这样的人。

有趣的是,我发现这些伟大物理学家,后期职业生涯的很多著作,并不仅关注原子世界或物质世界,而是思考同样大胆的问题,比如生命、智能、人类条件等;薛定谔写了《生命是什么》,罗杰·彭罗斯写了《皇帝的新装》,这让我对智能非常好奇;大学期间,我通过实习参加了一些神经科学实验室,特别是与视觉相关的实验室。

我想,这个问题与宇宙的起源或物质由什么构成一样,是一个同样大胆的问题,这促使我从本科物理学转到AI的研究生学位,尽管我不知道你是否有同样的经历;在我们时代,AI是贬义词,那是AI寒冬,更多是机器学习、计算机视觉与计算神经科学。

吴恩达:说实话,我大学时太忙于写代码,我完全忽视了AI寒冬,继续专注于编程。

李飞飞:是的,我太忙于解决偏微分方程。

我们还处在牛顿前的时期

吴恩达:你现在有一个大胆的问题吗?

李飞飞:我的大胆问题仍是智能。我认为自从艾伦·图灵以来,人类还没完全理解智能背后的基本计算原理,我们今天使用的词汇是AGI。归根结底,我仍梦想着一组简单方程或原理,可定义智能的过程,无论是动物智能还是机器智能。

这与物理学类似,很多人用飞行的类比来加入讨论,我们是在复制鸟的飞行还是在造飞机。很多人问关于AI与大脑间的关系问题。对我来说,无论我们是在造一只鸟,复制一只鸟,还是造飞机,归根结底,控制飞行过程的是空气动力学与物理学。我相信总有一天我们会发现...

吴恩达:我有时会思考这个学习算法假设,即很多智能可能并不是由一个或非常简单的机器学习原理来解释。看起来,我们离解开这个难题还有很长的路要走。但在周末,我们闲暇时间里思考学习算法及其可能走向,这是件让我兴奋的事,你知道,我对此非常期待。

李飞飞:我同意,我仍觉得我们处于牛顿前时期。如果用物理学类比,牛顿前已有伟大的物理学家,大量的现象学研究,关于星体运动等,但是牛顿开始提出非常简单的定律。我认为我们仍处在AI作为基础科学逐渐成熟的令人兴奋的时刻。

吴恩达:听你说,虽然机器学习与AI已取得如此大进展,但仍感觉还有很多未解决的问题,还有很多工作需通过可能是今天加入这个领域的人们来完成,而不是我们。

李飞飞:当然,我们来算一下,也就是60年左右。这是非常年轻的领域,现代物理学、化学、生物学已发展几百年。我认为,进入智能科学领域并研究AI是非常令人兴奋的事。

吴恩达:我记得曾与已故的约翰·麦卡锡教授交谈过,他创造了AI这个术语。这个领域自从他在一个研讨会上提出AI以来发生了很大变化,也许再过10年,现在正在观看这个视频的某个人会带来一套新想法,然后我们会说,AI与你、我当初想的完全不同,这是充满激动的未来。

李飞飞:我确定牛顿不会想到爱因斯坦,我们科学进化有时跨越式发展,有时需很长时间,我们现在绝对处于AI令人兴奋的阶段。

吴恩达:听到你为AI描绘这个宏伟的愿景真是有趣。稍微回顾一下,你刚开始时,我听说过你是物理学学生。不仅如此,你还开了一家洗衣店来支付学费。请告诉我更多关于这方面的事。

李飞飞:我在15岁时来到美国,实际上是来到新泽西州。在新泽西州一个伟大之处是它靠近普林斯顿。我经常与我父母一起去参观爱因斯坦后半生度过大部分时间的地方。但是,你知道,作为典型的移民生活并不容易,我进入普林斯顿时,我父母不会说英语。事情发展是这样的,开洗衣店可能是我家庭的最佳选择,特别是对我来说,作为一个学生来领导这个生意,这是一个周末营业的生意。

如果是平日生意,我很难既是学生又兼顾,而且洗衣店实际上需很多机器设备,这对像我这样的STEM学生来说是件好事。我们决定在新泽西州帕西帕尼小镇开了一家洗衣店。事实证明,我们离贝尔实验室并不远,那里进行了很多早期卷积神经网络的研究,但我当时对此一无所知。

吴恩达:那是你的暑期实习。

李飞飞:与罗布·夏皮罗一起。

吴恩达:迈克尔·柯伦特斯是我导师,那个宣传册,发明出了很棒的算法。

李飞飞:你编程时,我在试图找出来主权。

吴恩达:只是很晚之后。

李飞飞:那之后过了7年,我在整个本科阶段与大部分研究生阶段都在做那个,并雇佣了我父母。

吴恩达:是的,真是鼓舞人心。我知道你一直在进行激动人心的工作。你从经营一家洗衣店,到成为全球知名的计算机科学家,我希望这能激励一些正在观看的人,无论你在哪里,都有很多机会,你甚至都不知道。

我高中时工作是办公室管理员,到现在我还记得做了很多复印工作。最令人兴奋的部分是使用这个策略,感觉像一个光荣的人,我在高中时看到了那么多的咖啡,我想,也许我可做别的事,如果我能建造一个机器人来倒咖啡。

寻找北极星&Image的起源

吴恩达:当人们谈到你与你工作时,人们经常想到巨大成功是ImageNet,它为计算机视觉确立基准,对深度学习与计算机视觉的现代崛起起到非常重要推动作用。不过,不多的人知道你是如何开始研究图像的,告诉我们ImageNet的起源故事。

李飞飞:这是很好的问题。很多人只是把ImageNet视为标记大量图像的项目。但我们出发点实际上是追求北极星,这让我想起我的物理学背景。当我进入研究生阶段时……

吴恩达:你是哪一年进入研究生?

李飞飞:2000年。

吴恩达:我比你早3年,是1997年。

李飞飞:那是非常令人兴奋的时期,我在加州理工学院Pietro Perona与Christof Koch的计算机视觉与计算神经科学实验室里。之前有两件非常令人兴奋的事。首先,AI领域在那时并没被称为AI,计算机视觉或自然语言处理已找到它的语言,也就是微分,它作为新的工具出现,尽管它已存在很久。

吴恩达:我记得将机器学习应用于计算机视觉的想法当时还是有争议。

李飞飞:是的,我是第一代接受全部贝叶斯网络、推理算法等的研究生。这是一个令人兴奋的时刻。第二个令人兴奋的事,大多数人不知道,也没意识到,在20~30年时间里,视觉领域、人类视觉领域,进行了非常出色的认知科学与认知神经科学研究,确立了几个非常关键的北极星问题,就是对人类视觉处理与人类智能的理解,其中之一是对自然物体与自然事物的识别与理解。

很多心理学与认知科学的研究告诉我们,这是一种固有的、优化的功能,人类智能的能力比我们想象的更强大、更快速、更细致。我们甚至发现了与面部、地方或身体部位相关的神经相关性,这两件事导致我在博士研究中使用机器学习方法来研究现实世界中物体识别,但很快我们就感到非常痛苦,我们遇到AI与机器学习中最重要的挑战之一,即缺乏泛化能力,你可设计漂亮的模型,但如果你过度拟合模型。

吴恩达:我记得以前发表计算机视觉论文时,只需在一个图像上展示你的结果就可以了。

李飞飞:是的,它只是过度拟合,模型的表达能力不够强;我们缺乏数据,作为一个领域,我们过于依赖手工设计的特征。每一个变量都携带大量语义意义。然而,手工设计的特征并不充分,然后在我博士研究即将结束时,导师Pietro与我开始相互看着对方说,我们需更多的数据。

我们相信这个物体识别的北极星问题,并回顾我们现有工具,从数学角度说,我们对每一个遇到的模型都在过度拟合,我们需以新视角看待这个问题。一件事引发另一件事,他与我决定做一个当时被认为是大规模数据项目的Caltech 101。

吴恩达:我还记得那个数据集,我写过使用Caltech 101数据集的论文。你是和你早期研究生完成的吗?

李飞飞:对,我与我妈妈以及几个本科生一起进行标注,那时正值互联网早期阶段,突然间,数据可用性成为一件新鲜事物。我记得Pietro当时还有一台价格超贵的数码相机,我想它是佳能的,大约6,000美元,他拿着相机在Caltech周围拍照。

我们是互联网一代的人,我打开谷歌图片搜索,看到成千上万图片。我告诉Pietro,让我们下载下来,当然下载并不容易。于是,事就这样一步步发展,我们建立了这个Caltech 101数据集,包含101个物体类别,大约有30,000~50,000张图片。

吴恩达:我认为,即使如今人们都听说过ImageNet,你们实际上经历了几次迭代,先是Caltech 101,那是成功的尝试,很多人使用它,甚至在构建Caltech 101时的早期经验,为你构建一个更大的成功奠定了基础。

李飞飞:是的,不过到我成为系统教授时,我们开始看待这个问题,我意识到从数学上讲,Caltech 101远远不足以支持算法发展。我们决定做ImageNet,但当时人们开始认为我们做得太多了。这个想法,下载整个互联网的图片,映射出所有英语名词,有些人开始质疑,他们说,如果你无法识别一个物体类别,比如你坐在的椅子,拥有22,000个类别与5,000万张图片的数据集有什么用处?

吴恩达:是的,但最终,你那个巨大的数据集,为全世界无数研究人员带来很大价值。

李飞飞:我认为这是我们押注在正确的北极星问题上,并且有了支撑这个问题的数据,这是有趣的过程。

吴恩达:对我来说,这个故事中一个方面似乎是一个例子,有时人们觉得他们只应在一开始做一些规模较小的项目,但我觉得对从事机器学习工作的人来说,如果你的第一个项目规模较小,也完全可以;积累经验,逐步发展,有时你会得到像ImageNet这样巨大规模的项目。

李飞飞:是的,但与此同时,我认为以远大目标为驱动也很重要。你可将问题或项目大小作为一系列的里程碑,沿着这个过程前进,但我也看到我们现在一些学生受到当前不断发表论文的压力影响,他们为发表而发表,追求增量研究。我个人总是鼓励我学生提出问题,追求驱动他们的北极星是什么。

吴恩达:走在正确道路上。在我多年研究中,我一直基本上做自己感兴趣的事,试图推动前进。这并不意味着不听取别人意见,你要让他们分享观点。但最终,我认为最好的研究人员让世界分享他们意见,但最终会按照自己意见去推动事物。完全同意,这是你内心的热情。

AI的时代变革与社会责任

吴恩达:我对差分隐私等实际应用的发展感到鼓舞。正如你所说,联邦学习也是如此。过去几年,消费者在隐私方面认识越来越高,这是好的趋势。

李飞飞:非常重要。我认为公众也促使我们成为更好的科学家。

吴恩达:是的,我认为人们理解到AI对每个人都有责任,包括我们自己,这是做正确事的一个方面。

李飞飞:是的,对此我完全同意。我认为,AI教育与研究的下一个阶段需以人为本。我们成立人类中心的研究所HAI。我们相信,AI的进步与政策制定需以人为中心,我在政策方面更深入参与,是一个让我感到不舒服与缺乏专业知识的领域;在硅谷,有一种文化,我们只是不断制造东西,法律会自己跟上,但是AI正在影响人们生活,有时还会产生负面影响,这是我们所有人都不希望看到的。

如果专家们不与政策思考者、制定者坐在一起,真正努力使这项技术造福人民,我们就做得不好。我们谈论公平性,谈论隐私,我们还谈论AI流向工业界的人才流失,数据与计算能力集中在少数几个技术公司中。所有这些都是我们时代变革的一部分,有些变革令人兴奋,有些变革具有深远影响,我们可能还无法预测。

我们参与的一个政策工作是,我们是主导大学游说的一个大学,推动了一项全国AI研究资源的法案。这项法案呼吁建立一个任务组,为美国公共部门,特别是高等教育与研究部门,增加获取AI计算资源与数据的途径。它旨在恢复美国在AI创新与研究方面的生态系统;我在担任拜登政府的这项任务组中的12人之一,我们希望这项政策能建立与恢复生态系统。

吴恩达:我很高兴你正在努力帮助塑造美国政策,确保足够资源用于确保健康多样性。我觉得每个国家都需这样做。

李飞飞:没错。我们当初开始时,AI与机器学习的入门门槛相对较高,你几乎必须从计算机科学出发,作为一个物理专业学生,我还得费些周折才能转到计算机科学或电子工程的专业方向,从而接触到AI。但如今,我确实认为AI具有许多方面意义,可吸引来自各行各业的人。

技术方面说,显而易见的是,互联网上有丰富的资源,从Coursera到YouTube、TikTok,以及各种网站,世界各地学生可学习关于AI与机器学习的知识,与我们刚开始学习机器学习时相比,现在拥有的资源更加丰富。

不仅是大学校园,现在我们也看到更多高中甚至更早年级学校,提供相关课程与资源,对那些对技术有兴趣并有资源与机会的年轻人,我鼓励他们利用这些资源,这是一件非常有趣的事。

但是,对那些没技术背景,但仍对AI充满激情的人来说,无论是对下游应用感兴趣,还是对所引发的创造力、政策与社会问题感兴趣,无论是数字经济、治理、历史、伦理,还是政治科学等,我都邀请你们加入我们,还有很多工作需要做,有很多未知的问题等待解答。

例如,我与我在AI研究所同事正在探索并寻找关于数字时代经济定义的答案。当机器人与软件在工作流程中参与越来越多时,这意味着什么?如何衡量我们经济?这不是AI编程的问题,而是具有重大影响的问题,我们还在研究生成式AI的巨大进展,未来将对创意产生怎样影响,包括音乐、艺术、写作等领域。

我认为有很多担忧,这理所当然。与此同时,我们需共同努力去理解并利用这个新工具。总之,我认为现在是非常令人兴奋的时代,只要你对此充满激情,无论你来自哪个领域,都能发挥作用。

AI for All,谁将改变世界?

吴恩达:这真是令人兴奋的事。从经济学角度看,我们可考虑一下,比如与布林约尔松教授的讨论,研究AI对经济的影响。

从你观点看,无论你现在兴趣是什么,AI都是一种通用技术,当前兴趣与AI结合通常是有前景的。我发现,即使对那些可能还没具体兴趣的学习者来说,如果你进入AI领域,开始学习,兴趣往往会逐渐产生,并且你可开始找到自己方向。

鉴于AI目前发展状态,仍有很多空间,需更多人去开辟自己道路,从事这个令人兴奋的工作,我认为世界上还需更多这样的人。你们做的一项很棒的工作,是创办最初叫做少女SAILORS,后来改名为AI for All的项目,该项目致力吸引高中甚至更年轻学生,给他们提供更多在AI方面机会,包括来自各行各业的人,我很想听更多关于这个项目的信息。

李飞飞:这正是我们今天这次对话的主题。这是2015年开始,当时人们对AI开始产生很多兴奋感,但同时也开始有关于杀人机器人与终结者即将到来的讨论。

那时我担任SAILORS实验室主任,我认为人们担心的终结者问题可能有些牵强,我们知道终结者距离我们还有很长距离,但我对真正担心的问题却感到非常担心,那就是AI领域代表性不足。

当时,我是斯坦福AI实验室唯一的女性教职员工。而且,我们女研究生仅占总人数约15%,斯坦福AI项目中几乎没来自少数群体学生,这是一个全国甚至全球性的问题,不仅是斯坦福。

吴恩达:实际上,今天我们仍需在这方面做很多工作。

李飞飞:确实如此。我们该怎么做?在2015年与2017年,我与前学生Olga Russakovsky以及长期从事STEM教育的Rick Sommer博士合作,考虑邀请高中女生参加一个夏令营项目,激发她们对学习AI兴趣,这是它的起源;之后,我们得到Jensen、Laurie、Melinda Gates等人鼓励与支持。

我们成立AI for All的国家级非营利组织,致力培养并推动明天的AI领军人物,来自各行各业、尤其是传统上被忽视与代表性不足的社区学生。迄今为止,我们已在全国范围内开展许多夏令营与暑期项目,超过15所大学参与其中。我们还提供在线课程,鼓励学生参与,并通过匹配实习与导师来支持学生职业发展。我们一直在持续努力,鼓励各行各业学生参与进来。

吴恩达:我记得那时,你们团队还印制一些非常酷的T恤,上面写着AI将改变世界,谁将改变AI,这个问题的回答是确保每个人都能参与进来,这是一个很好的答案。

李飞飞:是的,这个问题至今仍非常重要。

吴恩达:这是很好的想法,我们对话即将结束,台前的你有什么最后的想法吗?

李飞飞:我想说的是,这是非常新生的领域,正如Andrew所说,我们还处在中途阶段,我仍觉得有很多问题需与实验室学生们一起解决,我每天早上都对此充满期待,我认为对那些想要学习、贡献与塑造明天AI的年轻人来说,现在有很多机会。

吴恩达:说得好,这次对话非常棒,感谢你的参与。

李飞飞:谢谢你,这次对话很有趣。

【长期主义】栏目每周六、与长假更新,分以下系列:

宏观说:全球各大国政要、商业领袖等

社会说:比尔·盖茨等

成长说:洛克菲勒、卡内基等

科学说:历年诺奖获得者、腾讯科学WE大会等

科技说:马斯克、贝索斯、拉里·佩奇/谢尔盖·布林、扎克伯格、黄仁勋、Vitalik Buterin、Brian Armstorng、Jack Dorsey、孙正义、华为、马化腾、张小龙、张一鸣、王兴等

投资说:巴菲特、芒格、Baillie Giffrod、霍华德·马克斯、彼得·蒂尔、马克·安德森、凯瑟琳·伍德等

管理说:任正非、稻盛和夫等

能源说:曾毓群等

汽车说:李想、何小鹏、王传福、魏建军、李书福等

智能说:DeepMind、OpenAI等

元宇宙说:Meta/Facebk、苹果、微软、英伟达、迪士尼、腾讯、字节跳动、EpicGames、Roblox、哔哩哔哩/B站等

星际说:中国国家航天局、NASA、历年国际宇航大会,SpaceX、Starlink、蓝色起源、维珍银河等

军事说:全球主要航空航天展等

消费说:亚马逊、沃尔玛、阿里、京东、拼多多、美团、东方甄选等

每个系列聚焦各领域全球顶尖高手、产业领军人物,搜集整理他们的致股东信、公开演讲/交流、媒体采访等一手信息,一起学习经典,汲取思想养分,做时间的朋友,做长期主义者。

相关研报:

人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来

九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利

九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI

九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体

人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字

九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿

九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切

【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上

【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付

【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启

【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起

【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆

【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横

【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动

【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现

九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切

【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会

九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变

【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集

【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集

【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集

【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变

【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐

九宇资本赵宇杰:对智能电动汽车产业的碎片化思考

九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术

【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓

【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异

【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国

【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆

【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村

六合君3周岁生日,TOP 60篇经典研报重磅推荐

下午茶,互联网世界的三国杀

5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代

新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式

【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇

知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期

从APP Store畅销榜4年更替,看内容付费崛起

新三板破万思考:新三板日交易量10年100倍?

九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会

九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会

九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态|2016 GNEC 新经济新营销峰会

请务必阅读免责声明与风险提示

0 阅读:0

科技有六合

简介:感谢大家的关注