Jul, 2024

通过模型合并减轻语言迁移中的灾难性遗忘

TL;DR提出了一种新的适应方法Branch-and-Merge(BaM),通过迭代合并多个模型,在可用训练数据的子集上进行微调,从而减少源领域的遗忘,同时在目标领域保持学习,从而显著降低遗忘并提高目标领域性能。