Mar, 2021

在混乱环境中有效学习面向目标的推 - 抓协同技能

TL;DR本文提出了一种高样本效率的目标导向层次强化学习模型,使用推和抓策略来实现在混乱环境下抓取指定目标物体,经过一系列实验验证表明,该模型表现出了高的任务完成率和目标抓取成功率,并能够适应目标不明确的条件,并且可以直接转移到实际应用中。