Mar, 2019

从游戏中学习潜在计划

TL;DR该论文提出了基于自我监督控制和玩耍数据的方法来扩大技能学习,结合自我监督控制和多样性玩耍数据集,实现了对环境中所有可用行为的连续学习,取得了在机器人桌面环境中 18 项视觉操作任务上的显著表现,同时表现出更强的抗干扰能力和重试成功的行为。