Mar, 2024

PPS-QMIX: 周期性参数共享加速多智能体强化学习的收敛

TL;DR多智能体强化学习中的训练过程耗时,当前研究通过引入集中化函数和周期性参数共享机制,有效加速了训练过程,并在 StarCraft Multi-Agent Challenge 中取得了显著性能提升。