Sep, 2019

为什么在强化学习中层级结构有时候能够成功?

TL;DR本研究评估了层次强化学习中多个优点在包含运动、导航和操作的任务套件上的表现,发现大多数观察到的层次性优势可以归因于改进的探索,而不是政策学习或强制性的层次结构。给定此洞察,我们提出了启发式的探索技术,其性能与层次强化学习相当,同时使用和实现要简单得多。