May, 2022

自适应多智能体强化学习

TL;DR本文介绍了自适应多智能体强化学习 (Self-paced MARL),它可以根据任务的难度自动优化智能体数量,实验结果显示该方法在智能体数量对任务难度有足够影响时可以提高任务表现。