Sep, 2024

我们能打破多智能体稳健强化学习的多机构诅咒吗?

TL;DR本文针对标准多智能体强化学习(MARL)算法对仿真与现实差距的脆弱性,提出了一类新型的稳健马克夫博弈(RMG)。研究表明,此方法能有效解决多机构诅咒的问题,开发的样本高效算法的样本复杂度与相关参数呈多项式关系,是首个在RMG中破除多机构诅咒的算法。