AI4GCC - 第三轨道：消费和多智能体强化学习的挑战

Aug, 2023

AI4GCC - 第三轨道：消费和多智能体强化学习的挑战

AI4GCC -- Track 3: Consumption and the Challenges of Multi-Agent RL

Marco Jiralerspong, Gauthier Gidel

TL;DRAI4GCC 竞赛在将机器学习与传统经济政策分析相结合方面迈出了大胆的一步。我们提出了两个改进的潜在方向，可以提高竞赛识别和评估提议的谈判协议的能力。首先，我们建议包括一个额外的指标，用于评估消费 / 效用。其次，我们建议进一步调查模拟器中代理人的学习动态以及提议的谈判协议结果的博弈论属性。我们希望这些建议对未来的竞赛 / 模拟有所帮助。

Abstract

The ai4gcc competition presents a bold step forward in the direction of integrating machine learning with traditional economic policy analysis

ai4gcc competition machine learning economic policy analysis negotiation protocols learning dynamics

发现论文，激发创造

经济政策的强化学习：一个新的前沿？

该论文回顾了传统的代理人建模技术在经济建模中的历史障碍，并思考最近强化学习等新兴技术能否克服其中的一些问题。

Jun, 2022

通过相互有条件的约束承诺改善国际气候政策

通过增强 Rice-N 模拟和多智能体强化学习框架来提高国际气候政策谈判的真实性，并通过纳入社会因素和非政府利益相关方子智能体来弥合模拟与现实之间的差距，同时提出了强化学习算法的改进，旨在更有效地评估和制定谈判协议以促进国际气候政策决策的发展，但需要进一步实验和测试来确定这些建议的影响和效果。

Jul, 2023

全球气候合作 AI 大赛 2023 论文集

应该结合人工智能与气候 - 经济模拟以设计应对气候变化的国际框架，同时也应该考虑到环境科学、法律和道德等领域，在此基础上，作者提出了 RICE-N 模型，并通过对其进行修改，参与了 AI for Global Climate Cooperation 竞赛，从三个角度对该模型提出了评估与建议。

Jul, 2023

使用强化学习验证实证博弈理论分析：一项连续双边拍卖研究

本文提出使用强化学习分析 EGTA 发现的 Nash 平衡策略的遗憾，并开发了强化学习工具库用于证明 EGTA 在连续双重拍卖市场研究中发现的均衡具有可接受的遗憾程度。

Apr, 2016

多智能体系统中的鲁棒性和泛化性能基准测试：神经互动多人在线游戏案例研究

第二届 Neural MMO 挑战赛的结果表明，在多智能体系统中的鲁棒性和泛化性能上取得了令人满意的成果，参与者通过使用标准强化学习方法结合领域特定的工程技术，训练出能够在与训练过程中未见过的对手下完成多任务目标的智能体团队。该挑战赛的设计和结果总结表明，作为学术界的一种强有力的方法，竞赛可以解决难题并为算法建立可靠的基准。我们将开源我们的基准测试，包括环境封装器、基准模型、可视化工具和选定的策略，以供进一步研究。

Aug, 2023

CompeteAI: 大型语言模型代理的竞争行为理解

大型语言模型的竞争行为研究：本文提出了一个通用框架来研究基于 LLMs 的代理之间的竞争行为，并使用 GPT-4 实现了一个模拟虚拟城镇的实际竞争环境，包括餐厅代理和顾客代理。研究发现竞争促使餐厅代理采取不同的运营策略，呈现出社会学和经济学理论所支持的一些有趣结果。

Oct, 2023

AI4GCC - 团队：在海平面以下：分数与真实世界的相关性

我们提出了一种用于 RICE-N 气候经济模拟的谈判协议，通过借鉴碳边境调整机制（CBAM）和气候俱乐部（CC）的方法来解决碳泄露问题。我们通过将模拟结果与代表性浓度路径（RCP）和共享社会经济路径（SSP）进行比较，证明了我们方法的有效性。我们的协议产生的温度上升与 RCP 3.4/4.5 和 SSP 2 相当。此外，我们对我们协议的世界贸易组织合规性、行政和政治可行性以及伦理问题进行了分析。我们意识到我们的提议可能会对最不发达国家造成伤害，因此我们建议采取特定的纠正措施，如技术共享和财富重新分配，以避免加剧现有的不平等问题。未来的研究应该改进 RICE-N 关税机制，并实施允许上述纠正措施的行动。

Jul, 2023

在多智能体环境中开发、评估和扩展学习智能体

DeepMind 的 “博弈论与多智能体团队” 研究了多智能体学习的多个方面，旨在使用深度强化学习探索复杂环境下的多智能体系统，并使用这些基准来推进我们的理解；本文总结了他们最近的工作并提出了一项分类，突显了多智能体研究中许多重要的开放性挑战。

Sep, 2022

商业游戏中创造代理的挑战和机会：“笨重且费时” 的问题

该研究通过对 AAA 工作室、独立工作室和工业研究实验室的 17 位游戏代理创作者的访谈，揭示了游戏代理制作面临的设计、实现和评估等几个方面的挑战。并与学术研究相比较，指出未来研究中支持游戏产业代理创作的方向。

Sep, 2020

公平与不公平：用深度强化学习量化市场模拟中的勾结

电子商务中基于人工智能的定价算法，特别是利用强化学习的算法，正变得越来越普遍。这项研究通过实验性寡头垄断模型的多次价格竞争，系统地改变环境以涵盖从基础经济理论到主观消费者需求偏好的各种情况，探究了代理人开发的策略和新兴定价模式，可能导致共谋结果。此外，我们还调查了代理无法观察到竞争对手价格的情景，并对所有情景进行了综合法律分析。我们的研究发现，基于强化学习的人工智能代理会趋于一种共谋的状态，其特点是收取超竞争价格，而无需进行代理间通信。实施其他强化学习算法，改变代理数量或模拟设置，以及限制代理的观察范围不会显著影响共谋市场的结果行为。

Jun, 2024