IJCAIMay, 2019
Successor Options: 基于继承关系的强化学习选项发现框架
Successor Options: An Option Discovery Framework for Reinforcement Learning
Rahul Ramesh, Manan Tomar, Balaraman Ravindran
TL;DR探讨一种名为 Successor Options 的新方法,该方法使用 Successor Representations 构建状态空间模型,通过学习伪奖励来了解内部操作策略,并且适用于高维空间的机器人控制环境。