Dec, 2017

深入探究经验回放

TL;DR本文系统地对经验回放进行了实证研究,发现经验回放的缓存大小超过一定阈值会严重影响性能;同时提出了一种 O(1) 方法来缓解大缓存在深度强化学习中的负面影响,并在简单的网格世界和具有挑战性的 Atari 游戏中证明了其效用。