ICLROct, 2018

层次强化学习的近乎最优表示学习

TL;DR研究了目标驱动分层强化学习中表征学习的问题,提出了表征的子最优性的概念,并给出了衡量表征子最优性的指标,用于优化表征学习目标。实验结果表明该方法在连续控制任务上具有优越性。