ICLROct, 2017

多智能体竞争引发的紧急复杂性

TL;DR本文介绍了几种在三维环境中进行竞争多智能体自我对抗训练的方法,这些方法可以训练出丰富多彩、技能复杂的智能体。此外,我们指出,自我对抗训练可以产生超出环境本身复杂性的行为,并且自带课程设置,有助于智能体学习不同难度水平下的技能。