Oct, 2019

无需演示学习可变形物体操纵

TL;DR本文介绍了基于无模型视觉强化学习的变形物体操作问题,通过提出迭代的拾取 - 放置空间和只显式学习放置策略来加速学习,并使用 MVP 选择策略,此学习框架在变形物体操纵任务方面获得了比独立空间快一个数量级的学习,并使用领域随机化将策略转移到 PR2 机器人上,对布料和绳索覆盖任务进行了实验验证。