Aug, 2024

通过对抗梯度情景记忆进行连续强化学习的数据增强

TL;DR本文解决了在连续强化学习中数据效率不足的问题,探索了数据增强技术的有效性。通过总结现有的数据增强方法并提出一种新的对抗增强方法Adv-GEM,实验证明这些数据增强技术能够显著提高传统连续强化学习算法的表现,减少灾难性遗忘,并促进知识的前向转移。