Sep, 2023

特化与泛化: 对基础模型微调中灾难性遗忘的实证研究

TL;DR为了解决fine-tuning中特性和广泛适用性之间的矛盾,我们研究了来自持续学习的多种规范化方法和来自越界通用化的权重平均方法,发现持续学习和Wise-FT方法可以有效减轻广泛适用性的损失,其中Wise-FT在平衡特性和广泛适用性方面表现最好。