ICLRDec, 2017
学习多级层次结构及回溯
Learning Multi-Level Hierarchies with Hindsight
Andrew Levy, George Konidaris, Robert Platt, Kate Saenko
TL;DR本文介绍了一种新的 Hierarchical Reinforcement Learning (HRL) 框架 - Hierarchical Actor-Critic (HAC),该框架能够克服在试图同时学习多个策略层级时出现的不稳定性问题,并能够在连续状态和动作空间的任务中成功地学习 3 级层级。