ICLRMar, 2023

MAESTRO: 多智能体强化学习的开放环境设计

TL;DR本文提出了 Multi-Agent Environment Design Strategist for Open-Ended Learning (MAESTRO) 算法,该算法在多智能体环境中使用 Unsupervised Environment Design (UED) 生成敌对性的联合任务集,MAESTRO 在竞争性的两人游戏中,跨离散和连续控制环境优于其他基线方法,并在 Nash 均衡点上获得了最小化后悔的保证。