Jan, 2019

多步深度强化学习的理解:对DQN目标的系统研究

TL;DR本论文对多步方法在深度强化学习中的表现进行了测试和分析,将包括Retrace和Q-learning等等在内的各种算法与DQN进行比较,在山车环境下进行了许多测试,指出需要注意调整backup length参数和target network更新的频率等细节来提高Q-learning等算法的性能。