AAAIOct, 2017

Rainbow: 深度强化学习的综合改进

TL;DR本文通过详尽的消融研究,考察了 6 种方法扩展 DQN 算法,实验结果表明这些方法的综合应用取得了 Atari 2600 基准测试最先进的性能,在数据效率和最终性能方面都取得了显著的改善。