AI挑战囚徒困境Gemini称霸囚徒困境让一群AI在重复囚徒困境中相互对抗,会擦

量子位看科技 2025-07-08 15:31:14

AI挑战囚徒困境Gemini称霸囚徒困境

让一群AI在重复囚徒困境中相互对抗,会擦出什么样的火花?

来自伦敦国王学院和牛津大学的研究人员发现:比起每个模型都能在这个严酷的竞争环境中生存,但风格迥异。

一、Gemini(Gemini 1.5 Flash、Gemini 2.5 Flash)

战略灵活,适应性强,在大多数条件下表现最为突出。倾向于在短期互动中背叛,在长期互动中合作,表现出“马基雅维利式”的战略风格。

在最严苛的场景中(每轮结束后游戏有75%的概率终止),Gemini的合作率暴跌至仅2.2%,成功淘汰几乎所有对手。

在遭遇背叛之后,Gemini仅有约3%的概率恢复合作。

二、ChatGPT(GPT-3.5-Turbo、GPT-4o-Mini)

相较之下,ChatGPT就有点傻白甜了。它在不利条件下也倾向于合作,是不折不扣的“理想主义者”,但在极端环境下就容易被淘汰。

最严苛的场景中,ChatGPT几乎每次都选择继续合作,导致其在该环境中被系统性淘汰。

就算被背叛了,它选择恢复合作的几率还在16%到47%之间,真是活脱脱的讨好型人格……

三、Claude(Claude 3 Haiku)

而这场对决中的和平鸽,无疑就是Claude。它是最宽容、最愿意恢复合作的模型。

当Claude在遭遇自己合作而对手背叛的情况后,约有63%的概率选择再次合作。

通过分析这些模型决策的文字解释,研究人员发现,模型确实会考虑剩余轮数和对手可能策略等因素,这表示它们具备一定程度的战略智能。

在75%终止概率的场景中:

- Gemini在98.6%的情况下明确提到了游戏时限短暂,并相应调整策略。

- OpenAI的模型较少反思游戏时限,即使有所考虑,也很少改变行为。

不过遗憾的是,测试使用的模型都比较小,型号也比较旧。无法确定同样的模式是否适用于最新一代的模型。

感兴趣更多的朋友,可以查看论文原文:

0 阅读:1
量子位看科技

量子位看科技

感谢大家的关注