Apr, 2019

像素领域中基于宽度规划的深度策略

TL;DR本研究扩展了基于宽度的规划算法并引入了显式的策略学习,以增强先前的回报信息。与先前的算法相比,将策略估计视为神经网络,用于引导规划,并展示了其在Atari游戏套件像素设置中的卓越表现,同时也去除了规划的预定义特征要求。