ICLROct, 2018

通过最大化转移和最小化干扰学习不遗忘的能力

TL;DR通过 Meta-Experience Replay 算法,在经验回放的基础上进行基于元学习的优化,实现了对未来渐变更少的干扰和更多的知识迁移。在多个领域的实验中,该方法优于目前的基准算法。