Sep, 2019

使用学习的任务模式进行高效双手操作

TL;DR本文研究了如何使用参数化技能有效地解决现实世界中的稀疏奖励任务,发现通过显式建模任务模式的状态独立性,可以极大地提高无模型强化学习算法的样本效率;同时,这些模式可以被转移用于解决相关任务。实验结果验证了我们的方法在机械手臂操作任务中的有效性。