Nov, 2023

融合遗忘:通过模型融合实现偏见降低和选择性记忆

TL;DR模型融合研究的目标是通过结合模型的权重来聚集多个模型的知识以增强性能。本文通过多个实验,针对文本分类和生成任务,深入研究了模型融合对学习过程中的快捷方式、社会偏见和记忆能力的影响,并发现模型融合通常会增强模型之间的共享知识,而未共享的知识通常会丢失或遗忘。基于这一观察,我们展示了模型融合作为一种去偏方法的潜力,并展示了它在解决与语言模型相关的隐私问题方面的效力。