ACLJun, 2023

预训练语言模型去偏方法参数效率的实证分析

TL;DR本文研究如何使用计算资源相对较小的方法,结合反事实数据增强技术(CDA)来减少预先训练的语言模型中的偏见,发现参数有效的方法能够有效地减少性别偏见,但对于种族和宗教偏见效果较差,且与全细调的性能相当。