AAAIOct, 2017
Rainbow: 深度强化学习的综合改进
Rainbow: Combining Improvements in Deep Reinforcement Learning
Matteo Hessel, Joseph Modayil, Hado van Hasselt, Tom Schaul, Georg Ostrovski...
TL;DR本文通过详尽的消融研究,考察了 6 种方法扩展 DQN 算法,实验结果表明这些方法的综合应用取得了 Atari 2600 基准测试最先进的性能,在数据效率和最终性能方面都取得了显著的改善。