AAAIJun, 2022

词向量中的性别偏见:频率、语法和语义的全面分析

TL;DR研究发现,英语语料库中的统计规律将社会中已知的性别偏见编码为词嵌入中的群体偏见。使用单类别词嵌入关联测试,作者发现广泛存在性别偏差,这些偏差在词频、词性标记、语义类别和情绪情感方面均有所不同。男性更倾向于与技术、工程、宗教、体育和暴力等概念相关联,而女性则偏向于涉及外观和厨房等领域。同时,男性相关的词汇具有更强的情绪唤起和主导性,而女性相关的词汇则更加温馨。