ICMLJul, 2019

多智能体对抗逆强化学习

TL;DR本文提出了一种新的多智能体逆强化学习框架(MA-AIRL),有效地解决了高维空间和未知动态的马尔科夫博弈问题,并展示了在策略模仿方面,MA-AIRL 显著优于现有方法。