ICMLAug, 2019

深度递归双 Q 学习用于 Atari 游戏

TL;DR本文介绍了基于深度强化学习的新模型,使用双 Q-Learning 算法和循环神经网络(如 LSTM 和 DRQN)的实现方案,应用在类似阿塔里游戏、马里奥等的视频游戏中,通过奖励数据进行自我学习。