Oct, 2022

基于因果推断的强化学习层次化结构发现

TL;DR本论文提出了 CDHRL 框架,通过因果驱动探索而非随机驱动探索来构建高质量的分层结构,以提高分层强化学习的探索效率。实验表明,在 2D-Minecraft 和 Eden 两种复杂环境中,CDHRL 显著提高了探索效率。