Oct, 2023

将持续学习重构为序列建模

TL;DR我们在这项工作中旨在建立起机器学习研究的两个重要领域之间的紧密联系:连续学习和序列建模。也就是说,我们提出将连续学习作为序列建模问题进行建模,使得先进的序列模型可以用于连续学习。通过采用元连续学习(MCL)框架,我们可以在元级别上对序列模型进行训练,应用于多个连续学习实验。作为我们新建模的具体示例,我们演示了将 Transformers 及其高效变体用作 MCL 方法的应用。我们在七个基准测试上进行了实验,涵盖了分类和回归问题,结果表明序列模型可以成为通用连续学习的一个有吸引力的解决方案。