研究表明AI看不懂多视角画面多模态新标准无一模型及格多模态大语言模型的多视角理解

量子位看科技 2025-05-14 15:26:48

研究表明AI看不懂多视角画面多模态新标准无一模型及格

多模态大语言模型的多视角理解有多难？GPT-4o竟然连及格线都没摸到。

所谓“多视图”理解，是让AI像人类一样从不同角度整合信息。

此前一直缺乏评测标准，UC伯克利、香港大学、牛津等团队，联合推出All-Angles Bench基准，专门评估AI模型在遮挡、相对位置判断、相机视角识别等方面的能力。

测试覆盖90个真实场景，2100+多视图问答对，囊括Counting、Attribute Identification、Relative Distance等六大任务，全面考察AI的三维理解力。【图1】

他们评测了27个主流模型，结果发现，多模态大语言模型与人类水平之间存在显著差距。

进一步研究发现，多模态大模型存在两种主要的缺陷模式【图2】：

（1）在遮挡情况下跨视图对应能力较弱；

（2）对粗略相机位姿的估计能力较差。

此外，GPT-4o有时会选择每个视角中的最大数量，而不是对跨视角的物体数量进行统一统计。【图3】

通过可视化的方法，研究人员让MLLM推理多视图下的物体和相机的位置与朝向。

虽然GPT-4o和Gemini-2.0-Flash对单张图像的场景理解表现尚可，但它们在对齐不同的相机视角时存在困难，难以正确处理视角变换。【图4】

论文：

项目：

0 阅读：6

量子位看科技

感谢大家的关注

作者最新文章

1

GPT4o生成诡异图片GPT4o生图提示词分享胆小慎入！GPT-4o生成诡异迷雾

2

用AI会让领导认为不积极吗研究表明用AI会被老板认为偷懒职场中，使用AI的人

3

三图解析RAG两大技术路线传统RAG与智能体RAG的核心差异你是否还不清楚传统R

4

第一批AI客服已经失业了仅有四分之一AI项目达到预期ROI第一批上岗的AI，已经

5

OpenAI微软修改数十亿美元合同OpenAI与微软为IPO展开谈判据《金融时报

6

开源模型媲美GPT4o图像生成编辑一体化神器GPT-4o横空出世后，全模态大模型

7

华为魔改DeepSeek精度效率双提升让AI提前停止推理反而更优大模型推理越来越

8

字节Seed首次开源代码模型字节Seed开源代码模型夺SOTA字节跳动的Seed

9

阶跃星辰坚持基础大模型开发多模态才是AGI入场券当大模型赛道中不少玩家明确表示放

10

一句话开发网页应用真的来了Qwen上线AI前端工程师功能Qwen上线的“AI前端

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

2

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

3

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

4

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

5

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

6

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

7

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

8

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

9

新机来了三星GalaxyS25FE6.67英寸120hz1080p直屏E

10

大哥这手机，我闭着眼睛都能认出来是啥

科技最新文章

1

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

2

很奇怪，我一直喜欢小屏手机，之前用过的华为Mate50，Mate50Pro，一

3

一天内添置了两台华为手机，一个是给老公买的华为mate70，一台是给婆婆买的华为

4

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

5

2699元起？华为nova15系列售价曝光，预计10月发布！

6

有点纠结？！如何选也呢？同为12+256G版本的华为Mate70Pro优享版和

7

原来苹果也知道，iPhone128gb不够用啊？看爆料说，iPhone1

8

直屏手机推荐来啦！荣耀Magic7绝对是不错的选择，搭载骁龙8至尊版芯片

9

荣耀power2配置曝光！根据数码闲聊站消息，这个天玑8500搭配100

10

荣耀X70拆机来看8300mAh的青海湖电池直接占了机身60%的空间！主板被压缩