AI挑战囚徒困境Gemini称霸囚徒困境让一群AI在重复囚徒困境中相互对抗，会擦

量子位看科技 2025-07-08 15:31:14

AI挑战囚徒困境Gemini称霸囚徒困境

让一群AI在重复囚徒困境中相互对抗，会擦出什么样的火花？

来自伦敦国王学院和牛津大学的研究人员发现：比起每个模型都能在这个严酷的竞争环境中生存，但风格迥异。

一、Gemini（Gemini 1.5 Flash、Gemini 2.5 Flash）

战略灵活，适应性强，在大多数条件下表现最为突出。倾向于在短期互动中背叛，在长期互动中合作，表现出“马基雅维利式”的战略风格。

在最严苛的场景中（每轮结束后游戏有75%的概率终止），Gemini的合作率暴跌至仅2.2%，成功淘汰几乎所有对手。

在遭遇背叛之后，Gemini仅有约3%的概率恢复合作。

二、ChatGPT（GPT-3.5-Turbo、GPT-4o-Mini）

相较之下，ChatGPT就有点傻白甜了。它在不利条件下也倾向于合作，是不折不扣的“理想主义者”，但在极端环境下就容易被淘汰。

最严苛的场景中，ChatGPT几乎每次都选择继续合作，导致其在该环境中被系统性淘汰。

就算被背叛了，它选择恢复合作的几率还在16%到47%之间，真是活脱脱的讨好型人格……

三、Claude（Claude 3 Haiku）

而这场对决中的和平鸽，无疑就是Claude。它是最宽容、最愿意恢复合作的模型。

当Claude在遭遇自己合作而对手背叛的情况后，约有63%的概率选择再次合作。

通过分析这些模型决策的文字解释，研究人员发现，模型确实会考虑剩余轮数和对手可能策略等因素，这表示它们具备一定程度的战略智能。

在75%终止概率的场景中：

- Gemini在98.6%的情况下明确提到了游戏时限短暂，并相应调整策略。

- OpenAI的模型较少反思游戏时限，即使有所考虑，也很少改变行为。

不过遗憾的是，测试使用的模型都比较小，型号也比较旧。无法确定同样的模式是否适用于最新一代的模型。

感兴趣更多的朋友，可以查看论文原文：

0 阅读：1

量子位看科技

感谢大家的关注

作者最新文章

1

无需思维链提升模型推理能力1千样本小模型ARC突破40分无需预训练或思维链，就能

2

逻辑能力趣味测试题超高难度数独挑战想知道自己的逻辑能力如何吗？不如来挑战一些国际

3

dLLM现致命安全缺陷只需掩码让模型自动越界扩散语言模型（Diffusion-b

4

AI搜索危机新解法Agent专用AI搜索ChatGPT刚刚给火热的Agent市场

5

AI模型潜意识会被带坏干净数据也能传染模型偏好Anthropic新研究令人震惊：

6

Gemini对话就能分割图像Gemini对话圈出图中物体Gemini 2.5支持

7

中国队拿下机器人世界杯总冠军清华火神队杀疯了机器人的世界杯总决赛，“国足”又赢了

8

美国打工人装懂AI取悦老板美国打工人不会用AI却装会最近，美国职场出现了一种荒诞

9

字节模型拿下IMO银牌字节数学模型能复现全过程字节的数学推理模型Seed Pro

10

小扎火速挖走谷歌摘金华人功臣谷歌刚夺金Meta就下手了扎心了！谷歌这边刚刚宣布获

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

格力把高管送去火焰山猴哥都抹汗的地方朱总靠空调坚持了下来。😅孙悟空要是有这条

2

罗永浩连怼网友罗永浩怎么了罗永浩连续发微博怼网友，他怎么了

3

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

4

苹果公司第三财季财报太靓丽了，仅仅iPhone16的营业收入就达到了445亿美

5

红米新机Redmi15外观渲染图曝光：后置三摄采用纵向排列的矩形Deco今

6

25年公认最强拍照手机，有你在用的吗。

7

马斯克已确认，三星拿下特斯拉165亿美元的合作，将为特斯拉生产芯片[doge]我

8

三星是不是都沉默了，这次又全面输给了荣耀三星GalaxyZFold7好不

9

荣耀Magic8全系曝光🔥四杯+7500mAh+2亿潜望荣耀Magic8系

10

目前最新的手机处理器排名，不出意外高通骁龙还是占据主流排第一的是骁龙8至尊领先

科技最新文章

1

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满

2

红米K90系列电池容量曝光，标准版7100毫安电池，Pro是7500毫安，因为标

3

小米的芯片困局又来了。英伟达被约谈的消息一出，雷军估计眉头紧锁。小米手机

4

只有华为Mate80RS非凡大师才能打，荣耀Magic8Ultra影像究竟有

5

荣耀最新旗舰荣耀Magic8系列配置预测，为了满足消费者的需求，这次的荣耀Mag

6

补充：华为Pura80Pro日均降价17.78元三星Galaxy

7

GalaxyS26Ultra带来了一些意想不到的升级•更大的主摄

8

今年荣耀的电池都做到8300mAh了，听说明年还能到10000mAh左右。其实不

9

苹果公司第三财季财报太靓丽了，仅仅iPhone16的营业收入就达到了445亿美

10

预1500元以内，这3款手机的性能和续航“最强”，轻松用五年红米Turbo3