ICMLJul, 2021

使用 Melting Pot 进行可扩展的多智能体强化学习评估

TL;DR本论文提出了一种名为 Melting Pot 的 MARL 评估套件,旨在评估新情况下的泛化能力,并使用强化学习降低开发新测试场景所需的人力成本。该套件由 80 个测试场景组成,覆盖了社交困境、互惠、资源共享和任务划分等广泛的研究领域,通过应用这些测试场景到标准 MARL 训练算法中,揭示了不仅仅是训练表现的弱点。