Feb, 2023
AdapterSoup: 利用权重平均来提高预训练语言模型的泛化能力
AdapterSoup: Weight Averaging to Improve Generalization of Pretrained
Language Models
TL;DR介绍了一种称为AdapterSoup的方法,通过对具有不同超参数的预训练语言模型适配器进行权重平均化从而提高在新领域的性能,同时使用文本聚类等方法选择哪些适配器进行组合,有效解决了在资源受限或领域特定问题下适配器训练的实践性问题。