ICLRNov, 2015

优先经验回放

TL;DR本文介绍一种优先回放经验的机制,使用该机制在深度 Q 网络中进行增强学习,提高了在 Atari 游戏中的学习效率, 超过了其他方法,成为了最新的最先进方法。