Jul, 2022

基于技能的模型驱动增强学习

TL;DR本研究提出了一种基于技能空间的模型强化学习(SkiMo)框架,使用技能动力学模型来规划,以实现精确和有效的长期规划,从而使学习复杂任务变得更加高效。该框架在导航和操作领域的实验结果表明,对于模型强化学习和技能强化学习,能够扩大时间范围并提高示范效率。