Jun, 2016

深度继承强化学习

TL;DR该论文介绍了 DSR,即在一个端到端的深度强化学习框架中,将 SR 进行了推广,通过奖励预测和继任者映射的分解提高了对远程奖励变化的灵敏度,并能够从随机策略下训练的继任者地图中提取瓶颈状态(子目标) 。然后在两个不同的环境中展示了该方法的有效性,包括简单的网格世界领域和 Doom 游戏引擎。