DC娱乐网

让我们投入10万亿美元发展改善现实世界的AI,而不只是优化广告

四年前,元宇宙概念正流行时,我曾发文称它是一场反乌托邦噩梦。我当时主张,与其沉浸虚拟世界,我们更应多与身边的现实世界联结。

时间会证明元宇宙最终能否成真,但2024和2025年,全球商务与休闲旅行、线下活动参与度均已超过疫情前水平,这很明显说明:人类本就不该活在头显设备里。

转眼到今天,有人正试图打造这样一个世界:内容越来越不来自朋友,甚至不来自人类网红,而是直接由AI模型生成——一种经过工程化制造的像素与波形,只为抓住你的注意力,直到下一条广告出现。

短短几年前,先进AI刚崭露头角时,人们对未来充满热情:一个人类繁荣的未来,医疗、材料、制造、机器人技术的突破性进步将让世界变得更好,提升地球上所有人的生活质量。

我认为现在有理由问一句:我们真的在朝这个方向走吗?我们对AI的巨额投资中,有多少会真正用于改善人类生存状况,又有多少会被用来制造更精巧的娱乐与分心手段?

为什么这件事现在至关重要

我们都清楚,大语言模型已成为科技史上最具颠覆性的创新之一,我们正进入一个意义重大的时代。它正在颠覆科技市场的方方面面:从初创公司到老牌企业,从芯片到软件、数据中心,甚至发电行业。

自OpenAI成立、现代AI产业崛起以来,全球已投入约1万亿美元,且这一数字还在每天增长,其中很大一部分正流向基础设施:芯片、服务器、数据中心和电力,为未来大规模高利润应用做准备。分析师认为,到2030年,AI总投资可能达到10万亿美元。即便与同期预计超过150万亿美元的全球GDP相比,这也是一笔天文数字。

或许更重要的是,建设这些基础设施正在消耗大量自然资源,包括石油、天然气和宝贵的淡水。外界越来越要求证明投资回报,而随着这些巨额杠杆投资不断累积,这种压力只会越来越大。

这些回报将从哪里来?是否存在一条路径,既能产生所需的经济回报,又能真正为人类建设更美好的未来?

答案之一,就在现实世界里

线上商品与服务约占全球经济的20%。当然,AI会让线上广告、社交网络、游戏变得更优质、更赚钱,也会优化软件工程、客服、营销、法律、医疗等白领工作。

但全球经济另外80%在这个范畴之外,就在现实世界里:能源、农业、制造业、建筑、交通与物流等行业。换句话说,是那些开采、提炼、种植、组装、合成、运输“实物”的活动——这些东西为我们供暖、遮风挡雨、提供食物,支撑人类的基本生活。这些才是人类最核心的需求,而不是聊天机器人。

要证明AI领域的巨额投入合理,就必须相信:AI不仅能改造线上20%的经济,更能改造线下80%的经济。如果我们能让AI在这部分经济中释放力量——并假设我们能妥善处理人类与机器协同工作的转型(这并非小事)——那么我们就真的有望迎来一个全人类生活水平共同提升的未来。这才值得为AI投入数万亿美元,更值得消耗电力、水资源等宝贵资源。

问题在于,AI在很多层面上被困在屏幕里。它对互联网海量文本提炼出的概念了如指掌,却对数据中心门外的世界一无所知,更不用说工厂车间、农田、建筑工地、炼油厂和我们生活的城市。要让AI在这片庞大的经济领域释放力量,我们必须给AI关于世界的知识、与世界交互的能力、以及能在物理世界行动的载体。它需要一颗适应现实世界的“大脑”,和一副能在现实中移动的“身体”。

只有大语言模型和世界模型还不够

这正是当下的机遇。这也是为什么AI行业对所谓物理AI、世界模型、空间智能充满期待。这也是英伟达黄仁勋对人形机器人如此兴奋的原因,他称其为“下一个数万亿美元级产业”。我们可以让AI适应物理世界,提升生产力,完成真实而有意义的工作——往往是人类不愿做或危险的工作。

只靠大语言模型不足以实现这一愿景。物理AI模型(通过视频等数据训练以控制机器人动作)、世界模型(试图模拟环境如何运行与演变,常生成场景的合成3D模拟)、空间模型(捕捉并重建物理世界),都将在实现这一愿景中扮演角色。

在物理AI领域,模拟与迁移学习的突破正让机器人实现流畅动作,以操控现实世界物体的新技能惊艳众人。世界模型则让模拟训练更简单、更真实,创造出无限多样的合成训练环境。

这些都是必要的进步,但还不足以让AI完全走进现实世界。

构建大型地理空间模型

在NianticSpatial,我们专注于最后一块缺失的拼图:空间智能。要让AI对现实世界的问题进行推理、规划和行动,它必须先“认识”世界。但AI缺乏人类狩猎采集者天然具备的直觉性空间理解能力,而它们训练所用的文本数据,也几乎无法让它连贯、准确地掌握物理世界的结构、形态、内容与拓扑关系。

过去几年,我们一直在构建一个大型地理空间模型,它就像一张活的、会呼吸的世界地图,一张为机器人和AI原生设计的地图。

不同于我以往开发的产品,这张地图不是为人而建,而是为机器而建——帮助机器人导航与任务规划,帮助AI完成需要基于现实数据的任务与问答。这张地图可以帮机器人规划穿过城市迷宫的最安全路线,在崎岖地形中将物资运送到偏远目的地,或在工地、工厂内移动并在不同地点作业。这类地图还能帮助AI智能体解决复杂现实问题,比如计算郊区火灾风险,或优化城市以提升生活质量。

我们在为人类构建地图(谷歌地图、地球、本地、街景)的所有经验之上继续前进,同时在一个以AI理解为核心目标的世界里重新想象它。正如谷歌地图成为Web2.0的关键基石,我们希望让Niantic地理空间模型成为未来AI的基石之一,与PhysicalIntelligence、SkildAI、FlexionRobotics等公司的物理AI模型,以及WorldLabs、GeneralIntuition、英伟达等公司的世界模型协同工作。这一切都在形成一个蓬勃发展的生态系统,其中还包括波士顿动力、AgilityRobotics、Apptronik等机器人公司,以及一大批为制造、农业、医疗等行业打造专用移动机器人的企业。

我们接下来的方向

这是一个令人兴奋的领域,多项创新同步推进。未来两个月,我们将发布新版模型,能够以人类可交互的方式重建现实,并让机器以毫米级精度“看见”与导航。未来版本还将加入更深层次理解、规划与解决问题所需的语义信息。

AI确实拥有巨大潜力。但能否把这笔巨额投资引向真正改善现实的技术,而不只是娱乐与分心工具,取决于我们每一个人。我相信,这才是值得我们所有人为之兴奋的事。