Jan, 2024

t-DGR:一种基于轨迹的连续决策深度生成回放方法

TL;DR深度生成回放在决策任务的连续学习中作为一种有希望的方法出现。本文提出了一种简单、可伸缩且非自回归的方法,使用生成模型根据轨迹时间步生成任务样本来解决遗忘问题,并在持续世界基准测试中达到了最先进的性能。