Oct, 2023

DiFair: 评估性别知识和偏见的可分解基准

TL;DR使用 DiFair 数据集作为基准,通过设计统一评估指标,研究了许多广泛使用的预训练语言模型和去偏技术,发现存在的性别偏见得到了证实,同时也证明了去偏技术虽然改善了性别偏见问题,但通常会降低模型的有用性别知识。