ICLRMar, 2023

规划探索目标

TL;DR本文提出了 Planning Exploratory Goals(PEG)方法,在目标条件强化学习中以直接优化内在探索奖励为目的,为每个训练周期设置目标,从而最大限度地探索环境,通过学习世界模型和适应采样规划算法来规划目标命令,从而实现更有效的训练。