Apr, 2019

上下文化词嵌入中的性别偏见

TL;DR本文中,我们量化、分析和减轻了 ELMo 上表现的性别偏见。通过内在分析和实验,我们发现 ELMo 的训练数据中包含男性实体比女性实体多,其编码的词向量中存在性别信息,且男性和女性实体所包含的性别信息不平等。同时,我们发现最前沿的指代消解系统很大程度上依赖 ELMo,继承了 ELMo 的性别偏见,表现出显著的偏见,我们探索了两种减轻这种性别偏见的方法,并展示了这种在 WinoBias 数据集上表现出的偏见可以被消除。