AAAIJul, 2018

使用继承表示实现基于计数的探索

TL;DR介绍了基于继承代表(successor representation)的强化学习的简单方法,利用其转移概念的范数作为奖励来激励探索,以及用隐式计数实现高效完备探索,并在 Atari 2600 游戏中实现了最先进的性能。