Dec, 2023

基于接触能的回顾经验优先级

TL;DR本文介绍了一种基于接触能量的优先选择机制,用于解决强化学习中多目标机器人操作任务中稀疏奖励收集成功经验低效的问题,并在各种机器人操作任务中对该方法进行了评估。