Oct, 2017

Rainbow: 深度强化学习的综合改进

TL;DR本文通过详尽的消融研究,考察了6种方法扩展DQN算法,实验结果表明这些方法的综合应用取得了Atari 2600基准测试最先进的性能,在数据效率和最终性能方面都取得了显著的改善。