Jun, 2020

检测新兴交叉偏见:上下文化词嵌入包含类人偏见的分布

TL;DR通过引入 Contextualized Embedding Association Test (CEAT) 来度量神经语言模型中的整体偏见及其方差,并开发了自动识别交叉偏见和新现出的交叉偏见的方法 (IBD 和 EIBD),结果表明交叉偏见与种族和性别相关的次数最高。