Feb, 2017

深度多智能体强化学习的稳定经验回放

TL;DR该研究提出了两种解决 multi-agent reinforcement learning 中 nonstationarity 问题的方法,并在 StarCraft 单元微观管理的分散式变量上得到了成功的实验结果。