Oct, 2021

基于路标引导的分层强化学习子目标生成

TL;DR本文介绍了 HIerarchical reinforcement learning Guided by Landmarks (HIGL) 框架,该框架通过引导探索性的 Landmarks 来训练具有减少动作空间的高层级策略,实现高效探索。实验结果表明,该框架在控制任务中表现优异。