Jul, 2023

基于解离式可达性规划的目标驱动强化学习

TL;DR我们提出了一种基于目标条件的强化学习算法,结合了解缠绕的可达性规划(REPlan),用于解决时间延展任务,在模拟和真实世界任务中,REPlan显著优于之前最先进的方法。