IJCAIJun, 2024

Pommerman 多智能体训练:课程学习与基于人口自我对弈的方法

TL;DR该研究介绍了一个使用课程学习和基于群体的自我对弈相结合的系统,用于训练多智能体系统玩 Pommerman,并解决了稀疏奖励和合适匹配机制的两个挑战性问题。实验结果表明,我们训练的智能体可以在不需要盟友间通信的情况下胜过顶尖的学习智能体。