当地时间10月22日,WSJ发布与苹果高级副总裁、软件主管Craig Federighi 的访谈视频。在访谈中,Craig Federighi谈到了苹果的AI战略,以及为什么在他人急于将人工智能推向市场时,苹果选择了慢慢来。
Craig Federighi强调,苹果的战略是长期的,可能会持续数十年。“当我们考虑任何功能特别是Apple Intelligence的发展路线时,这不是一次性的情况。这是一个多年,甚至是几十年的技术发展过程。所以我们会负责任地推进。”
以下是访谈全文,智能超参数编译,内容略有删减,enjoy:
提问:自ChatGPT推出以来已经快两年了,苹果在生成式AI方面落后了。但苹果从来都不是新技术产品类别的领跑者。Apple intelligence有什么新特性?
Craig Federighi:我们不是简单地考虑如何构建另一个聊天机器人并将其附加到现有体验中,而是要创造一些深度集成的东西。最重要的是,我们将其视为个性化服务。以往的聊天机器人主要关注完全不了解用户的产品。它们很强大,也很有趣,有一些出色的用途。但我认为,对于使用我们产品的用户而言,真正强大的智能应该是能够理解你的智能。
这带来了巨大的责任,因为要实现这一点,这种智能必须处理存储在你设备上的信息。这意味着隐私是一个极其重要的考虑因素。
提问:ChatGPT和其他大型语言模型会将每个提示发送到它们强大的云服务器。然而,苹果优先考虑隐私,通过直接在设备上运行AI模型来实现。只有在需要更多处理能力时,才会调用其加密的基于云的模型。苹果称之为私有云计算。能否解释一下你们是如何决定哪些应该在本地完成,哪些应该使用私有云计算?
Craig Federighi:有些情况,比如说长文本摘要。非设备模型可以尝试完成这项任务,但可能无法提供最佳结果。
如果我们在云端运行,既可以更快,也能提供更高质量的结果。但重要的是数据是不可访问的。你要求总结的信息会被加密发送到云端的可信设备,该设备进行人工智能处理后返回结果,而不会记录任何关于该数据或邮件的信息。苹果无法访问那封邮件。其他人也不能。然后它就消失了。
提问:为什么其他云计算都不这样运作?
Craig Federighi:首先,这很难构建。我认为这也与许多公司关于他们如何看待数据的整个哲学背道而驰。对于许多公司来说,我认为他们的答案是:把你们所有的数据都发送给我们,以我们可以读取和处理的方式存储在我们这里。因此,当你向我们的云提出问题时,我们已经有了你的数据,我们将使用我们对它进行的任何处理来回答你的问题。
但作为用户,你并不确定这就是他们要做的全部吗?也许他们现在没有用它做什么,但他们有我的数据,将来会用它做什么?我不知道。
提问:说到AI+苹果,苹果长期以来一直有一个承诺,Siri是你的智能助手,只需开口询问就能帮你完成任务。Siri推出至今已有13年,这让人难以置信。Siri是否终于要实现这个承诺了?
Craig Federighi:这个过程永无止境。Siri现在每天要处理大约15亿次请求。我用Siri完成很多事情。我用它打开车库门,关闭车库门,打开灯,各种各样的事情。我发送消息,设置计时器。每天都有成百上千万的用户在使用它做各种事情。所以Siri确实能做很多事情。
但作为人类,我们对使用语音来沟通和提出要求的期望几乎是无限的。
好消息是,Siri现在很有用,多年来在很多方面为许多人提供帮助,但它正变得越来越有用,因为Apple intelligence和大语言模型的能力意味着Siri可以比以往更好地理解你,并且将能够访问设备上更多的工具来为你做更多事情。
但是否会有一个时刻,我们说,Siri现在是我有意识的伙伴?这个不会。但它会继续变得越来越好。
提问:苹果承诺Siri将能够根据你的日历、消息等内容回答更深入的问题。它还将整合ChatGPT来回答某些问题,但这些功能都还没有推出。这个更智能的Siri在哪里?
Craig Federighi:正在来的路上。它会分阶段到来。通过Apple intelligence,我们创建了理解个人背景并能采取行动的基础。Siri正在分阶段采用这些功能,并将在未来一年内分阶段受益。
提问:最近OpenAI发布了Advanced Voice Mode。这种大型语言模型的整合是否在Siri的未来规划中?
Craig Federighi:我今天不会宣布任何事情,但我要说的是,我认为这些都很棒。这只是显示了这个领域发展得有多快,以及为什么我们都对这种技术的潜力如此兴奋。
OpenAI的Advanced Voice Mode和Siri的特性是很不同的。如果你想问关于量子力学的问题,让它写一首关于它的诗,然后回答其他问题等等,OpenAI的模式很棒。
但它不会打开你的车库门。它不会帮你发送短信。Siri每天为你做很多有用的事情。它快速完成这些事情,在你的设备上本地完成。这里有一个范围。在各种能力之间有权衡。
这些领域会融合吗?当然,这就是发展的方向。
提问:现在Apple Intelligence中的一个工具是通知摘要。我每天收到太多关于车库门开关的通知,然后它会对这些进行总结,并告诉我最后一次的状态,比如门是关着的。但是当AI总结一些个人信息时,比如说分手或争吵的消息,有些人觉得这很不恰当,甚至觉得很搞笑。
Craig Federighi:你说得对,有各种各样的通信内容。有时这些是敏感事项,在一些情况下,我们会说,我们没有针对这种情况进行训练,我们不会处理它,我们实际上不会自动总结通知,因为我们认为,我们可能不会在这方面做得很好。
但在其他情况下,我们会继续。最近有一个故事,我猜是有人分手了。它给出了一个非常客观的描述。我认为它总结得并不糟糕,但我的意思是,无论如何没人想通过短信分手,所以这注定不会是一个好时刻。
提问:另一个现在已经准备好的AI工具是清理功能。选择清理功能,你可以点击删除画面中你不喜欢的物品,AI会填充剩余部分。(记者跟Craig Federighi自拍了一张照片,图中有麦克风和饮料瓶在不起眼的角落里)一些公司选择了一个相当极端的路线,能够生成照片的新部分。你们采取了一个不同的方法。为什么?
Craig Federighi:是的,我要说即使是删除图片中饮料瓶的那个能力,内部也有很多争议。我们是否要让删除水瓶或麦克风变得容易,因为那个水瓶确实在那里。人们对清理照片中看似多余的细节的需求非常高,这些细节并不从根本上改变所发生的事情的含义。
所以,我们愿意采取这个小步骤。但我们也有担心,摄影有着悠久的历史,人们将摄影内容视为可以依赖的现实指示物。而且我们的产品,我们的手机使用频率很高。
对我们来说,帮助传递准确信息而不是幻想很重要。即使你删除了照片的一些细节,我们也会更新照片的元数据,这样人们可以回去查看这是一张经过修改的照片。
提问:现在,Apple Intelligence的功能有限。与你们在六月份展示的相比,很多功能都不在。为什么推迟?
Craig Federighi:是的,我们从今年开始就知道,我们对Apple Intelligence的愿景和实现它的道路不是在9月一次性全部推出的时刻。我们从WWDC介绍它的那一刻起就传达了这一点。这是一个重大工程,我们想要把它做好。
你可以推出一些东西,让它变得混乱,或者,苹果的观点更像是让我们试图把每个部分都做对,在准备好时再发布。
当我们考虑任何功能,特别是Apple Intelligence的发展路线时,这不是一次性的情况。这是一个多年,甚至是几十年的技术发展过程。所以我们会负责任地推进。
提问:但另一方面,你们也在进行营销。你们推出了iPhone,为它做宣传。
Craig Federighi:这很合理。我们希望那些对未来感到兴奋的客户知道,如果我买这部手机,能否实现这些功能?答案是肯定的。所以我认为,我们在传达这一点的同时,也要确保每个人都明白这些功能将在未来几个月内推出,而不是今天全部到位。
提问:什么会很快推出呢?
Craig Federighi:我们很快就会推出一个AirPods清洁指南。我的技术太不卫生了,不便提及,那会比我目前使用的技术好得多。