Mar, 2020

演化种群课程用于多智能体强化学习的扩展

TL;DR本研究提出了一种进化人口课程学习模式 (EPC),以解决在多智能体游戏中训练大型人口的问题,采用进化方式解决利益不一致问题和保留每个阶段的多个智能体组以优化其适应性。并将 EPC 应用于 MADDPG 算法中,实验结果表明本方法在多智能体增长的情况下能够始终优于基准算法。