IJCAIMay, 2019

Successor Options: 基于继承关系的强化学习选项发现框架

TL;DR探讨一种名为 Successor Options 的新方法,该方法使用 Successor Representations 构建状态空间模型,通过学习伪奖励来了解内部操作策略,并且适用于高维空间的机器人控制环境。