Jun, 2019

强化学习中什么时候使用参数模型?

TL;DR研究了参数模型和经验回放的共性和区别,探讨了何时以及如何在强化学习中使用参数模型,验证了使用经验回放算法生成虚拟转换来提高数据效率的假设,并在 Atari 2600 视频游戏中实现了最新数据效率的提升。