ACLFeb, 2023

通过性别不明确的代词进行反事实偏见评估的计数器

TL;DR本文提出了一种新的方法通过反事实生成来收集多样性,自然性和最小距离的文本对,并构建了一个由 4008 个实例分成 1002 个四重组成的 Counter-GAP 注释数据集,以评估语言模型在固指消解中的性别偏见问题。作者使用四重组级别指标解决了以前的偏差取消问题,并发现四个预训练的语言模型在不同性别组之间的不一致性显着大于在每个组内部的不一致性,姓名为基础的反事实数据增强方法比匿名化方法对减少这种偏见更有效。