ICLROct, 2018

图卷积强化学习

TL;DR本文提出了一种使用图卷积强化学习的方法,通过使用关系内核捕获代理之间的相互作用来适应多代理环境的动态,并利用逐渐增大感受野的卷积层产生潜在特征来学习合作,此外,为了保持一致性,还使用了时间关系正则化方法。实验表明,该方法在各种合作场景中显着优于现有方法。