ACLMay, 2024

适配器模块在文本分类中性能、效率和公平性之间的权衡

TL;DR当前的自然语言处理(NLP)研究倾向于仅关注一到两个维度,如性能、隐私、公平性或效率,这可能导致次优的结论,并常常忽视实现可信赖的 NLP 的更广泛目标。适配器模块的工作主要关注提高性能和效率,并未对公平性等其他方面的意外后果进行调查。我们在三个文本分类数据集上进行实验,通过(1)微调所有参数或(2)使用适配器模块来研究性能和效率。关于性能和效率,我们确认了先前的发现,即适配器增强模型的准确性大致与完全微调的模型相当,而训练时间大大缩短。关于公平性,我们发现适配器模块在敏感群体之间造成了混合的公平性。进一步研究发现,当标准微调模型表现出有限的偏见时,适配器模块通常不会引入额外的偏见。另一方面,当微调模型表现出增加的偏见时,适配器模块对偏见的影响变得不可预知,可能会导致对某些群体的偏见显著放大的风险。我们的发现强调了需要进行个案评估,而非一刀切的判断。