清华唐杰团队让大模型打牌大模型玩斗地主惯蛋清华唐杰团队新论文：大语言模型（LLM

量子位看科技 2025-09-09 14:15:12

清华唐杰团队让大模型打牌大模型玩斗地主惯蛋

清华唐杰团队新论文：大语言模型（LLM）能不能像AlphaGo那样，玩复杂纸牌游戏？

团队挑了八个游戏，包括斗地主、掼蛋、麻将、德扑、UNO等，用高质量数据对模型进行微调，看它能不能学会这些规则复杂的卡牌。结论还挺有意思：

- 只要数据好，LLM确实能学会这些游戏，甚至打得不比传统AI差；

- 不同游戏一起学也没问题，像斗地主和掼蛋这种相似玩法还能互相参考；

- 但如果把麻将、UNO这种机制差很多的游戏混在一起训练，模型反而会“晕”；

- 学会打牌之后，模型在常规任务上的能力（比如数学、编程）会下降，但加点通用训练数据又能拉回来。

研究中最关键的一点，是LLM不需要为每个游戏设计专属架构，靠数据微调就能上手，这跟之前围棋AI需要定制网络不大一样。

不过，这篇论文也引发了一些质疑。声音主要集中在论文含金量方面【图2】。

但不管怎么说，这篇论文展示了一种新的思路：LLM能否成为通用策略代理（general strategic agent），如果LLM连斗地主都能玩明白，也许未来能搞定更多复杂决策任务。

论文地址：arxiv.org/abs/2509.01328

0 阅读：53

猜你喜欢

Topson：虽然Spirit淘汰了，但是我必须要再称赞一次Yatoro，看他的

Topson：虽然Spirit淘汰了，但是我必须要再称赞一次Yatoro，看他的

【5评论】

yatoro 圣剑

提问：这是什么游戏？弱智吧日常

提问：这是什么游戏？弱智吧日常

盘点王乐晨三次明显的拒绝（个人解读）p1，第4期上。柯暴走，卢远在后面远远跟着，

盘点王乐晨三次明显的拒绝（个人解读）p1，第4期上。柯暴走，卢远在后面远远跟着，

心动的信号心动的信号8 王乐晨卢远

D王之术1、卸磨杀驴的最高境界，就是制造一个诱惑让他自己离开。2、降维打击的最高

D王之术1、卸磨杀驴的最高境界，就是制造一个诱惑让他自己离开。2、降维打击的最高

【1评论】【84点赞】

驴

坦克100有多炫？都说看那智能头盔就好。电动TK没声音，戴上头盔，驾驶起来，足堪

坦克100有多炫？都说看那智能头盔就好。电动TK没声音，戴上头盔，驾驶起来，足堪

坦克

XG在本届TIBP方面的一些特点：他们非常喜欢后选，截至目前XG一共打了10小

XG在本届TIBP方面的一些特点：他们非常喜欢后选，截至目前XG一共打了10小

【1评论】

ame

量子位看科技

感谢大家的关注

作者最新文章

1

iOS26支持机型苹果发布会

2

iPhone17Pro手机壳苹果发布会 iPhone 17 Pro手机壳，此前大

3

iPhone17系列定价iPhone17系列定价揭晓iPhone 17起售价$7

4

iPhone17Pro配色

5

iPhone17Air配色iPhone17Air主摄4800万像素史上最薄iPh

6

iPhone17售价5810iPhone17功能汇总iPhone17标准款也Pr

7

iPhone17新增紫蓝绿配色iPhone17新配色iPhone17新配色来了?

8

AppleWatch起售价1810元苹果手表Ultra3续航42小时苹果发布三款

9

AppleWatchSeries11表身史上最薄AppleWatchSeries

10

AirPodsPro3定价1775元新款AirPods能翻译能测心率AirPod

热门分类

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

追觅造车了！造扫地机器人的那个追觅没想到啊，造车牌桌上一个接一个退场…这时候竟然

4

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

5

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

6

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

7

罗永浩拉黑俞敏洪王自如对话任何一位，流量肯定爆炸。但聊不到一起，也没必要。甚至都

8

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

科技最新文章

1

iPhone17系列国行版的电池容量曝光了（靠谱版），具体如下：iPhone

2

【荣耀彻底杀疯！】Magic8系列这次真的不讲武德——配置堆到天花板，连吐槽

3

k80至尊版天马屏vs华星屏。可以直观的看出，屏幕发绿的是天马屏，通透的是华星屏

4

能够和小米16相抗衡的国产旗舰，估计也就只有华为Mate80了。小米16已

5

即将上市的四大机器，这里面我还是会选择oppo，因为已经习惯了ColorOS系统

6

马斯克全球封杀李雪晨！这李雪晨本来只是马斯克底下子公司的骨干开发人员，这下出

7

Magic6用户要哭了，赶紧换Magic8吧！消息已经确定，MagicOS10

8

近日，AI圈惊爆一则重大消息：Anthropic发表声明，明确规定但凡由中国

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

目前已知的信息：全新外观设计ProMax电池容量超过5000mAh全系A19全