Jun, 2023

强化学习中的预训练模型调制学习

TL;DR本文旨在研究强化学习中的遗忘问题,提出了基于 Learning-to-Modulate 的解决方案,并在 Meta-World 和 DMControl 数据集上进行了实验验证,表明该方法在 Continual-World 基准测试中取得了最优表现。