ACLSep, 2023
去偏对于语言模型在下游任务中的影响被低估
The Impact of Debiasing on the Performance of Language Models in Downstream Tasks is Underestimated
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki
TL;DR通过使用包含女性、男性和刻板印象的单词的各种基准数据集,我们比较了去偏见对多个下游任务性能的影响,实验证明去偏见的影响在所有任务中都被一致地低估。此外,通过单独考虑包含女性、男性和刻板印象单词的实例,而不是所有实例,可以可靠地评估去偏见的影响。