COLINGOct, 2022

除偏不足!—— 浅谈消除 MLM 和社会偏见在下游任务中的有效性

TL;DR本研究探讨了遮盖语言模型的任务非特定内在社会偏见和任务特定外在社会偏见评估指标之间的关系,并发现两种评估指标之间存在着很弱的相关性。 此外,我们发现使用不同方法去除偏见的 MLM 在下游任务的精调期间仍会重新学习社会偏见。 我们发现训练实例及其分配的标签中的社会偏见是内在和外在偏见评估测量之间差异的原因。 总之,我们的研究结果强调了现有 MLM 偏见评估措施的局限性,并令人担忧地提出了使用这些措施在下游应用中部署 MLM 的问题。