Mar, 2019

基于梯度的在线持续学习样本选择

TL;DR本文提出了一种控制遗忘的连续学习方法,通过基于有约束优化的观点来选择回放缓冲区的样本,以减少学习中遗忘的现象,并且与其他基于任务边界的现有方法进行了比较。