编辑:LRST 好困
【新智元导读】近日,清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖(Outstanding Paper Award)。该会议于2024年8月11日至16日在泰国曼谷举办,获得此项荣誉的论文约占投稿论文总数的0.79%。宏观经济学在上个世纪经历了多次危机与发展。
从18世纪亚当·斯密古典宏观经济学中「看不见的手」到上世纪20~30年代美国大萧条时期的凯恩斯革命,从二战后萨缪尔森的新古典综合到70~80年代美国滞涨时期的货币主义,从新古典宏观经济学的理性预期到行为经济学,尤其是2008年全球金融危机后,对宏观经济现象的研究越来越重视对人的复杂行为的准确建模。
20世纪末到21世纪初,基于代理的建模(Agent-based Modeling, ABM)在计算经济学中受到一定程度的关注。
ABM强调了主流方法动态随机一般均衡(DSGE)模型中「完美世界」假设的缺陷,旨在通过模拟微观个体的行为及其交互自下而上地涌现出宏观层面的典型化事实(Stylized facts),例如GDP增长与波动、通胀与失业率的权衡。
然而,由于个体行为规则需要专家设定,并带来模型校验、可解释性有限的问题,ABM模拟在宏观经济学领域的发展一定程度上受限。
如今,大语言模型(LLM)的出现催生了各个领域的智能体研究并取得了多方面的成功,验证了LLM强大的推理与决策能力,这为模拟更真实的经济个体提供了有效途径。
论文链接:https://arxiv.org/abs/2310.10436v4
清华大学团队的这项工作使用LLM构造EconAgent,在一个宏观经济系统中模拟了个体的工作与消费行为,并相较于传统ABM模拟涌现出了更稳定、真实的典型事实(Stylized fact, 即经典的宏观经济现象)。
EconAgent与经济模拟系统
论文第一作者为清华大学博士生李念,合作者包括清华大学李勇教授、高宸助理研究员、廖庆敏教授。
经济模拟系统的构建
为尽可能保证经济模拟的真实性,经济系统包括了必要的经济活动,包括个体、公司、政府、银行等经济对象,以及工作、消费、定价等经济活动:
个体通过工作取得月收入;政府按照税收政策对所有个体征税,并将税收平均返还;个体决定将税收收入和储蓄的一部分用于消费生活必需品;个体的工作带来必需品的生产供应,个体的消费带来必需品的消费需求,结合当前的库存,供需不平衡会带来消费市场与劳动市场的动态变化,即商品价格与个体工资的变动;每年个体在银行的储蓄得到一些利息;银行通过常用的Taylor Rule进行每年的利率调整。EconAgent智能体设计
为了使EconAgent能根据自身与外部的经济状况作出合理决策,研究者进行了如下几方面设计。
首先,在prompt中赋予了个体差异化的、基于现实世界的画像,包括年龄、姓名、职业等,使得每个个体都具有独特的特征和背景,从而能够模拟真实世界中个体的多样性和复杂性。
其次,prompt中描述了真实经济环境中的生活场景,使得EconAgent够感知与理解经济环境中的信息及其变化趋势,从而作出正确合理的响应。进一步地,研究者对智能体设计了记忆模块,以模拟广泛的宏观经济趋势对个体决策的影响;
如此一来,EconAgent不仅能够感知当前的经济环境,还能够考虑市场环境的历史变化和长期趋势。
最后,EconAgent综合考虑多类经济因素做出自主决策,不依赖于预定义的规则。
反思prompt与结果:个体能感知劳动市场与消费市场的变化
实验结果:宏观经济现象与规律的自主涌现
研究者模拟了一个百人经济系统,每个模拟步代表一个月,共进行了20年的模拟,从宏观经济指标与经济规律两个方面对模拟结果进行验证,并与基于规则的ABM模拟[1,2]以及RL方法[3]进行对比。
1. 宏观经济指标:通胀率、失业率、名义GDP、名义GDP增长率
实验结果表明,基于EconAgent的模拟涌现出数值更合理、波动更稳定的宏观经济指标。例如,通胀率不超过10%、在第3年后基本达到稳定。
宏观经济指标
2. 宏观经济规律:Phillips Curve、Okun’s Law
实验结果表明,基于EconAgent的模拟涌现出更合理的经济规律,而其它方法的结果出现了错误的Phillips Curve:失业率与工资通胀率并不是负相关关系。
宏观经济规律
EconAgent的决策行为分析
为进一步探究EconAgent所做的决策是否符合真实世界的经济常识,研究者对其工作与消费决策进行多个经济因素的回归分析。
结果表明,当税收越少、政府返还越多、预期收入越高时,工作意愿越高;当储蓄越高、上个月消费越少时,消费占储蓄比例越低,意味着EconAgent会保持稳定的消费水平;此外,商品价格也是影响工作与消费意愿的重要因素。以上结论均与现实世界中的人类行为相吻合。
研究者进一步研究EconAgent是否自主地表现出决策机制中的异质性。
上图(a)展示了消费倾向随年龄增长而逐步增加,这与在传统宏观经济研究中观察到的经验规律大体一致[4]。
研究者通过与EconAgent的交互,进一步解读了Phillips Curve中出现负相关的可能原因。首先,计算失业率最高和最低的两年中所有Agent的平均消费倾向。
上图(b)展示了比较结果,其中***表示显著差异(p < 0.001),可以观察出高失业率导致消费倾向显著降低。
为了更深入地了解在高失业率的劳动市场中选择减少消费的原因,随机选择一个Agent,并基于在失业率最高的那一年的行为决策历史,结合每个季度的经济动态,为所做出的消费决策提供理由。以下结果表明,Agent对宏观经济趋势有所感知,在面对高失业率下的劳动市场通货紧缩时,会选择谨慎消费。
研究者进一步探究了重要事件对EconAgent行为的影响以及由此产生的宏观经济模拟结果的变化,这也是许多ABM研究中广泛讨论的一个话题[5]。
以对全球经济产生重大影响的COVID-19为例,研究者通过prompt的方式将其纳入模拟中,如下所示:
下图对比了失业率的变化情况,其中「Normal」和「COVID-19」分别表示有无上述提示的模拟结果。
结果表明基于EconAgent的模拟成功地复现了全球失业率的增长,尽管数值与真实数据并不完全匹配,但这表明所提出的框架能够定性模拟重要事件对宏观经济产生的影响。
以下是EconAgent的反思示例。
进一步地,研究团队将EconAgent与研发的OpenCity智能体平台[6]相结合,基于EconAgent驱动北京真实街区中的个体工作、消费行为,与企业的生产行为等经济活动的模拟仿真。
总结与展望
总而言之,该论文工作结合LLM智能体与经济模拟,为计算经济学的研究范式开辟了一条新的可能道路,未来有望以DSGE等主流模型为目标,向更精准、更真实的模拟迈进。
进一步地,关于大语言模型智能体ABM模拟及其在社会、经济、物理、网络等领域应用的相关工作,团队还发布了首篇综述论文:《Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives》,该论文已被Humanities and Social Sciences Communications接收。