让我们投入10万亿美元发展改善现实世界的AI，而不只是优化广告

四年前，元宇宙概念正流行时，我曾发文称它是一场反乌托邦噩梦。我当时主张，与其沉浸虚拟世界，我们更应多与身边的现实世界联结。

时间会证明元宇宙最终能否成真，但2024和2025年，全球商务与休闲旅行、线下活动参与度均已超过疫情前水平，这很明显说明：人类本就不该活在头显设备里。

转眼到今天，有人正试图打造这样一个世界：内容越来越不来自朋友，甚至不来自人类网红，而是直接由AI模型生成——一种经过工程化制造的像素与波形，只为抓住你的注意力，直到下一条广告出现。

短短几年前，先进AI刚崭露头角时，人们对未来充满热情：一个人类繁荣的未来，医疗、材料、制造、机器人技术的突破性进步将让世界变得更好，提升地球上所有人的生活质量。

我认为现在有理由问一句：我们真的在朝这个方向走吗？我们对AI的巨额投资中，有多少会真正用于改善人类生存状况，又有多少会被用来制造更精巧的娱乐与分心手段？

为什么这件事现在至关重要

我们都清楚，大语言模型已成为科技史上最具颠覆性的创新之一，我们正进入一个意义重大的时代。它正在颠覆科技市场的方方面面：从初创公司到老牌企业，从芯片到软件、数据中心，甚至发电行业。

自OpenAI成立、现代AI产业崛起以来，全球已投入约1万亿美元，且这一数字还在每天增长，其中很大一部分正流向基础设施：芯片、服务器、数据中心和电力，为未来大规模高利润应用做准备。分析师认为，到2030年，AI总投资可能达到10万亿美元。即便与同期预计超过150万亿美元的全球GDP相比，这也是一笔天文数字。

或许更重要的是，建设这些基础设施正在消耗大量自然资源，包括石油、天然气和宝贵的淡水。外界越来越要求证明投资回报，而随着这些巨额杠杆投资不断累积，这种压力只会越来越大。

这些回报将从哪里来？是否存在一条路径，既能产生所需的经济回报，又能真正为人类建设更美好的未来？

答案之一，就在现实世界里

线上商品与服务约占全球经济的20%。当然，AI会让线上广告、社交网络、游戏变得更优质、更赚钱，也会优化软件工程、客服、营销、法律、医疗等白领工作。

但全球经济另外80%在这个范畴之外，就在现实世界里：能源、农业、制造业、建筑、交通与物流等行业。换句话说，是那些开采、提炼、种植、组装、合成、运输“实物”的活动——这些东西为我们供暖、遮风挡雨、提供食物，支撑人类的基本生活。这些才是人类最核心的需求，而不是聊天机器人。

要证明AI领域的巨额投入合理，就必须相信：AI不仅能改造线上20%的经济，更能改造线下80%的经济。如果我们能让AI在这部分经济中释放力量——并假设我们能妥善处理人类与机器协同工作的转型（这并非小事）——那么我们就真的有望迎来一个全人类生活水平共同提升的未来。这才值得为AI投入数万亿美元，更值得消耗电力、水资源等宝贵资源。

问题在于，AI在很多层面上被困在屏幕里。它对互联网海量文本提炼出的概念了如指掌，却对数据中心门外的世界一无所知，更不用说工厂车间、农田、建筑工地、炼油厂和我们生活的城市。要让AI在这片庞大的经济领域释放力量，我们必须给AI关于世界的知识、与世界交互的能力、以及能在物理世界行动的载体。它需要一颗适应现实世界的“大脑”，和一副能在现实中移动的“身体”。

只有大语言模型和世界模型还不够

这正是当下的机遇。这也是为什么AI行业对所谓物理AI、世界模型、空间智能充满期待。这也是英伟达黄仁勋对人形机器人如此兴奋的原因，他称其为“下一个数万亿美元级产业”。我们可以让AI适应物理世界，提升生产力，完成真实而有意义的工作——往往是人类不愿做或危险的工作。

只靠大语言模型不足以实现这一愿景。物理AI模型（通过视频等数据训练以控制机器人动作）、世界模型（试图模拟环境如何运行与演变，常生成场景的合成3D模拟）、空间模型（捕捉并重建物理世界），都将在实现这一愿景中扮演角色。

在物理AI领域，模拟与迁移学习的突破正让机器人实现流畅动作，以操控现实世界物体的新技能惊艳众人。世界模型则让模拟训练更简单、更真实，创造出无限多样的合成训练环境。

这些都是必要的进步，但还不足以让AI完全走进现实世界。

构建大型地理空间模型

在NianticSpatial，我们专注于最后一块缺失的拼图：空间智能。要让AI对现实世界的问题进行推理、规划和行动，它必须先“认识”世界。但AI缺乏人类狩猎采集者天然具备的直觉性空间理解能力，而它们训练所用的文本数据，也几乎无法让它连贯、准确地掌握物理世界的结构、形态、内容与拓扑关系。

过去几年，我们一直在构建一个大型地理空间模型，它就像一张活的、会呼吸的世界地图，一张为机器人和AI原生设计的地图。

不同于我以往开发的产品，这张地图不是为人而建，而是为机器而建——帮助机器人导航与任务规划，帮助AI完成需要基于现实数据的任务与问答。这张地图可以帮机器人规划穿过城市迷宫的最安全路线，在崎岖地形中将物资运送到偏远目的地，或在工地、工厂内移动并在不同地点作业。这类地图还能帮助AI智能体解决复杂现实问题，比如计算郊区火灾风险，或优化城市以提升生活质量。

我们在为人类构建地图（谷歌地图、地球、本地、街景）的所有经验之上继续前进，同时在一个以AI理解为核心目标的世界里重新想象它。正如谷歌地图成为Web2.0的关键基石，我们希望让Niantic地理空间模型成为未来AI的基石之一，与PhysicalIntelligence、SkildAI、FlexionRobotics等公司的物理AI模型，以及WorldLabs、GeneralIntuition、英伟达等公司的世界模型协同工作。这一切都在形成一个蓬勃发展的生态系统，其中还包括波士顿动力、AgilityRobotics、Apptronik等机器人公司，以及一大批为制造、农业、医疗等行业打造专用移动机器人的企业。

我们接下来的方向

这是一个令人兴奋的领域，多项创新同步推进。未来两个月，我们将发布新版模型，能够以人类可交互的方式重建现实，并让机器以毫米级精度“看见”与导航。未来版本还将加入更深层次理解、规划与解决问题所需的语义信息。

AI确实拥有巨大潜力。但能否把这笔巨额投资引向真正改善现实的技术，而不只是娱乐与分心工具，取决于我们每一个人。我相信，这才是值得我们所有人为之兴奋的事。

DC娱乐网

让我们投入10万亿美元发展改善现实世界的AI，而不只是优化广告

热门分类