Apr, 2023

CRISP: 层次强化学习中课程引导的基本原语子目标预测

TL;DR本文提出了一种新的分层算法,通过生成可实现的子目标的课程来训练逐层递进的策略,通过在少量专家演示中使用基础解析方法进行数据重标注,得到了可以用于多数机器人控制任务的适用的逐层递进的强化学习算法,实验结果表明,课程学习可以显著提高分层强化学习的效率。