Aug, 2024

利用注意力机制学习不遗忘的学习方法

TL;DR该研究针对当前机器学习方法容易遗忘先前学习经验的问题,通过提出一种基于变压器的元学习优化器,来增强持续学习的能力。该方法利用注意力机制学习模型参数之间的复杂关系,有效生成当前任务的权重更新,并在遇到新任务时避免灾难性遗忘,验证了其在标杆数据集上的有效性。