ICMLJun, 2023

持续学习者是增量模型泛化器

TL;DR本文的研究重点是探讨 Continual Learning 模型作为预训练器的效果,研究表明,CL 模型可以学习到改进的任务 - 一般特征,在保留丰富任务 - 一般特征的同时,运用 GLobal Attention Discretization fine-tuning 可获得竞争力的性能表现。