Feb, 2017
深度多智能体强化学习的稳定经验回放
Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning
Jakob Foerster, Nantas Nardelli, Gregory Farquhar, Triantafyllos Afouras, Philip H. S. Torr...
TL;DR该研究提出了两种解决 multi-agent reinforcement learning 中 nonstationarity 问题的方法,并在 StarCraft 单元微观管理的分散式变量上得到了成功的实验结果。