Mar, 2023

使用目标条件策略模拟基于图的规划

TL;DR该论文提出了一种基于图形规划算法和自我模仿的方法,通过提取子目标策略来优化目标目标策略,从而提高在长期任务中实现指定目标的样本效率。