Nov, 2023

LM-Cocktail:通过模型合并实现语言模型的可靠调整

TL;DR通过模型合并的方法(LM-Cocktail),将预训练语言模型与微调的模型通过加权平均的方式融合,以使得微调模型在一般任务中能够保持强大的实际性能,同时在特定领域具有优越的能力。