BriefGPT.xyz
Apr, 2019
我们是否存在一致偏差?对分布式词向量偏差的多维分析
Are We Consistently Biased? Multidimensional Analysis of Biases in Distributional Word Vectors
HTML
PDF
Anne Lauscher, Goran Glavaš
TL;DR
该研究对分布式词向量空间中的偏见效应进行了系统性分析,研究表明:偏见效应在不同的词向量模型、文本类型和语言之间是不一致的,同时,双语词向量空间中的跨语言偏见也是存在的。该研究以期促进自然语言处理中的偏见研究,为偏见缓解技术的发展提供帮助。
Abstract
word embeddings
have recently been shown to reflect many of the pronounced
societal biases
(e.g., gender bias or racial bias). Existing studies are, however, limited in scope and do not investigate the consistenc
→