【AI前沿速递】大模型社会影响与自我进化新突破
本周arXiv发表两项引人注目的AI研究。
第一项来自牛津大学Stratis Tsirtsis团队的论文"AI-Mediated Communication Can Steer Collective Opinion"揭示LLM在社交媒体中的隐性影响力。研究发现,当LLM编辑争议话题文本时会系统性引入方向性偏差,例如在枪支管控话题上引导支持管制,在无神论话题上倾向反对。研究者建立意见动态数学模型,证明AI引入的偏差会通过社交网络放大并偏移集体意见。对X平台"Explain this post"功能审计发现Grok输出存在pro-life偏差,追溯到特定设计选择。
第二项研究来自Igor Bogdanov等人提出的FORGE框架,解决LLM agent无需梯度更新即可通过自我生成记忆改进决策的问题。该框架采用分阶段、基于群体的协议,核心创新是"群体广播"机制:专门的反省agent将失败轨迹转换为可重用知识制品,通过外循环将表现最佳实例的记忆传播给整个群体。在CybORG CAGE-2测试中,FORGE相比零样本基线提升1.7-7.7倍,相比Reflexion基线提升29-72%,主要失败率降至约1%。研究发现群体广播是关键机制,较弱模型获益不成比例,表明该框架可能缓解而非放大能力差距。
两项研究分别从AI社会影响和技术进化两个维度推进了对大模型的理解。
AI资讯 人工智能