May, 2022

物理引导的分层奖励机制用于学习式物体抓取

TL;DR本文提出了基于物理引导的深度强化学习方法用于改善学习效率和推广性,在多指机器人手势能力的数据集上进行测试,结果表明,该方法在任务性能方面优于标准深度强化学习方法 48% 和学习效率 40%。