Sep, 2019
为什么在强化学习中层级结构有时候能够成功?
Why Does Hierarchy (Sometimes) Work So Well in Reinforcement Learning?
Ofir Nachum, Haoran Tang, Xingyu Lu, Shixiang Gu, Honglak Lee...
TL;DR本研究评估了层次强化学习中多个优点在包含运动、导航和操作的任务套件上的表现,发现大多数观察到的层次性优势可以归因于改进的探索,而不是政策学习或强制性的层次结构。给定此洞察,我们提出了启发式的探索技术,其性能与层次强化学习相当,同时使用和实现要简单得多。