AI找到了从“语言高手”进化成“现实主宰者”的道路-世界模型!马斯克亲自站台,力挺李飞飞的世界模型理念:机器要真正懂世界,就必须跳出文字,拥抱图像空间的Hadamard式思考,这场范式革命或将重塑机器人、虚拟现实与人类未来。
李飞飞作为ImageNet的缔造者、“AI教母”,长期倡导让AI真正“看见”并理解物理世界。她指出,语言模型虽在概念和词汇上表现出色,但本质上是处理抽象符号的“文字匠人”,无法天然捕捉光影变化、物体受力、时空动态等现实基石。世界模型则不同,它直接学习空间与时间的统计结构,能从任意视角想象场景、预测物理交互,这正是通往具身智能和高级机器人技术的必由之路。
数学家Jacques Hadamard曾描述顶级思想者往往不在文字或精确公式中思考,而是用模糊的图像、空间感和整体“感觉”来探索问题。这种“图像空间思考”正是世界模型追求的核心:让AI在连续、高维的潜在空间中进行几何感知和模拟推理,而非局限于离散的token序列。这与xAI、Tesla的自动驾驶世界模型实践高度契合——它们用视频和模拟数据构建内部“现实引擎”,实现单步扩散生成等前沿技术。
