Apr, 2020

无监督离策略强化学习实现真实世界机器人技能

TL;DR本文提出的无监督技能发现算法可用于进行高效无监督增强学习,通过模型预测控制将学习到的技能组合用于目标导航。