AAAIFeb, 2020

利用追溯法在连续学习中锚定过去的知识

TL;DR通过将经验回放与新的 “锚定” 目标相结合,使用双层优化来更新当前任务的知识,同时保持对过去任务的一些锚点的预测,以减少遗忘。在多个监督学习基准测试中进行实验,证明了我们的方法在精度和遗忘度量方面改进了标准经验回放,并适用于各种大小的情节性记忆。