AAAISep, 2019

从少到多:大规模动态多智体课程学习

TL;DR本文通过设计一种新的名为 DyMA-CL 的动态多智能体课程学习方法,在小规模智能体学习场景的基础上逐步增加智能体数量来解决大规模多智能体学习问题。同时,提出了三种跨课程的转移机制来加速学习过程,并设计了一种名为 DyAN 的动态智能体数量网络结构来处理网络输入的动态大小。实验结果表明,相对于现有的深度强化学习方法,DyMA-CL 使用 DyAN 可以大大提高大规模多智能体学习的性能,通过大量模拟还研究了三种课程间的转移机制的影响。