Sep, 2021

自然语言推理中的标记属性偏差

TL;DR对 NLP 应用中有害偏差进行报告和提供测试集对于建立对当前问题的强大理解至关重要。通过观察新的标记属性偏差,我们总结了某些向下 NLP 应用中的性别偏差。针对有偏差的词嵌入可能是消除偏差的最具影响力的第一步。通过研究嵌入词汇的内在属性如何促成这种观察到的标记属性效应,以及当前的后处理方法是否成功解决偏差问题,调查了当前的去偏思路,发现下述两个问题:当前的去偏嵌入方案中没有一个能够缓解标记属性误差,也没有一个内在偏差测量能够预测标记属性影响。通过发现一种新类型的内在偏差测量与标记属性效应有意义的相关性,我们提出了针对静态词嵌入的新的后处理去偏方法,将提出的方法应用于现有嵌入中,取得了标记属性偏差测试集上的最佳结果。