Oct, 2022

DHRL: 一种基于图的长时间和稀疏层次强化学习方法

TL;DR本文提出了使用图形解耦合高层次和低层次策略视野的分层强化学习方法,该方法可以使高层次策略的操作间隔更加灵活,从而实现更长的时域抽象和更快的训练。与现有的分层强化学习算法相比,该方法在数据效率方面表现更好,在典型的分层强化学习环境中实现了复杂任务的长期和复杂的运动和操作。