Mar, 2023

针对协作式多智能体强化学习的可扩展价值分解探索算法

TL;DR本文提出了一种可扩展的价值分解探索方法(SVDE),包括可扩展的训练机制、内在奖励设计和探索性经验回放,以加速样本生成并改善探索问题。实验结果显示,在 StarCraft II 微观管理游戏中,该方法在几乎所有地图上实现了最佳性能。