ACLMay, 2019

使用性别平等的损失函数减少单词级语言模型中的性别偏见

TL;DR本研究提出一种基于损失函数修改的去偏见方法,旨在平衡输出中男性和女性单词的概率;通过使用一系列偏差评估指标,我们提供实证证据表明我们的方法成功地减轻了语言模型中的性别偏见。与现有的去偏见策略,数据扩充和单词嵌入去偏见相比,我们的方法在多个方面,特别是在减少职业单词中的性别偏见方面表现更好。最后,我们介绍了一种数据扩充和我们方法的组合,并展示它在所有偏差评估指标中表现出优于现有策略的效果。