Jul, 2023
基于解离式可达性规划的目标驱动强化学习
Goal-Conditioned Reinforcement Learning with Disentanglement-based Reachability Planning
Zhifeng Qian, Mingyu You, Hongjun Zhou, Xuanhui Xu, Bin He
TL;DR我们提出了一种基于目标条件的强化学习算法,结合了解缠绕的可达性规划(REPlan),用于解决时间延展任务,在模拟和真实世界任务中,REPlan 显著优于之前最先进的方法。