IJCAIApr, 2016

深度学习用于奖励设计,提高 ATARI 游戏中的蒙特卡罗树搜索

TL;DR本文提出了一种结合 PGRD 和深度学习的方法,利用卷积神经网络自动学习特征来改进 UCT 算法在 ATARI 游戏中的表现。