AI4GCC - 第三轨道:消费和多智能体强化学习的挑战
通过增强 Rice-N 模拟和多智能体强化学习框架来提高国际气候政策谈判的真实性,并通过纳入社会因素和非政府利益相关方子智能体来弥合模拟与现实之间的差距,同时提出了强化学习算法的改进,旨在更有效地评估和制定谈判协议以促进国际气候政策决策的发展,但需要进一步实验和测试来确定这些建议的影响和效果。
Jul, 2023
应该结合人工智能与气候 - 经济模拟以设计应对气候变化的国际框架,同时也应该考虑到环境科学、法律和道德等领域,在此基础上,作者提出了 RICE-N 模型,并通过对其进行修改,参与了 AI for Global Climate Cooperation 竞赛,从三个角度对该模型提出了评估与建议。
Jul, 2023
本文提出使用强化学习分析 EGTA 发现的 Nash 平衡策略的遗憾,并开发了强化学习工具库用于证明 EGTA 在连续双重拍卖市场研究中发现的均衡具有可接受的遗憾程度。
Apr, 2016
第二届 Neural MMO 挑战赛的结果表明,在多智能体系统中的鲁棒性和泛化性能上取得了令人满意的成果,参与者通过使用标准强化学习方法结合领域特定的工程技术,训练出能够在与训练过程中未见过的对手下完成多任务目标的智能体团队。该挑战赛的设计和结果总结表明,作为学术界的一种强有力的方法,竞赛可以解决难题并为算法建立可靠的基准。我们将开源我们的基准测试,包括环境封装器、基准模型、可视化工具和选定的策略,以供进一步研究。
Aug, 2023
大型语言模型的竞争行为研究:本文提出了一个通用框架来研究基于 LLMs 的代理之间的竞争行为,并使用 GPT-4 实现了一个模拟虚拟城镇的实际竞争环境,包括餐厅代理和顾客代理。研究发现竞争促使餐厅代理采取不同的运营策略,呈现出社会学和经济学理论所支持的一些有趣结果。
Oct, 2023
我们提出了一种用于 RICE-N 气候经济模拟的谈判协议,通过借鉴碳边境调整机制(CBAM)和气候俱乐部(CC)的方法来解决碳泄露问题。我们通过将模拟结果与代表性浓度路径(RCP)和共享社会经济路径(SSP)进行比较,证明了我们方法的有效性。我们的协议产生的温度上升与 RCP 3.4/4.5 和 SSP 2 相当。此外,我们对我们协议的世界贸易组织合规性、行政和政治可行性以及伦理问题进行了分析。我们意识到我们的提议可能会对最不发达国家造成伤害,因此我们建议采取特定的纠正措施,如技术共享和财富重新分配,以避免加剧现有的不平等问题。未来的研究应该改进 RICE-N 关税机制,并实施允许上述纠正措施的行动。
Jul, 2023
DeepMind 的 “博弈论与多智能体团队” 研究了多智能体学习的多个方面,旨在使用深度强化学习探索复杂环境下的多智能体系统,并使用这些基准来推进我们的理解;本文总结了他们最近的工作并提出了一项分类,突显了多智能体研究中许多重要的开放性挑战。
Sep, 2022
该研究通过对 AAA 工作室、独立工作室和工业研究实验室的 17 位游戏代理创作者的访谈,揭示了游戏代理制作面临的设计、实现和评估等几个方面的挑战。并与学术研究相比较,指出未来研究中支持游戏产业代理创作的方向。
Sep, 2020
电子商务中基于人工智能的定价算法,特别是利用强化学习的算法,正变得越来越普遍。这项研究通过实验性寡头垄断模型的多次价格竞争,系统地改变环境以涵盖从基础经济理论到主观消费者需求偏好的各种情况,探究了代理人开发的策略和新兴定价模式,可能导致共谋结果。此外,我们还调查了代理无法观察到竞争对手价格的情景,并对所有情景进行了综合法律分析。我们的研究发现,基于强化学习的人工智能代理会趋于一种共谋的状态,其特点是收取超竞争价格,而无需进行代理间通信。实施其他强化学习算法,改变代理数量或模拟设置,以及限制代理的观察范围不会显著影响共谋市场的结果行为。
Jun, 2024