Apr, 2020
无监督离策略强化学习实现真实世界机器人技能
Emergent Real-World Robotic Skills via Unsupervised Off-Policy Reinforcement Learning
Archit Sharma, Michael Ahn, Sergey Levine, Vikash Kumar, Karol Hausman...
TL;DR本文提出的无监督技能发现算法可用于进行高效无监督增强学习,通过模型预测控制将学习到的技能组合用于目标导航。