Jul, 2016

使用深度强化学习和人类检查点重现玩雅达利游戏

TL;DR这篇文章提出了一种使用深度强化学习来学习玩最困难的Atari 2600游戏的新方法,即基于人类游戏经验的检查点回放,并使用卷积神经网络作为模型,其结果显著优于先前的学习方法和随机玩家,同时提出了一种使用人类游戏经验来训练深度强化学习智能体的方法。