一种因果推断方法用于减少词嵌入关系中的性别偏见
通过提出一种基于因果推断框架的新方法来有效消除性别偏见,该方法可以在保留嵌入式语义信息的同时构建和分析性别信息流的复杂因果机制,从而在性别去偏任务中取得最新的技术结果。
Dec, 2021
通过自然语言推理任务设计机制,测量陈旧的语义观念对词向量嵌入产生的影响。通过静态和动态嵌入中的偏见消除策略,减少了对其下游模型的无效推断,特别是对性别偏见的消除策略能够扩展到上下文嵌入中静态组件的有选择性应用(ELMo、BERT)。
Aug, 2019
提出了一种名为 RAN-Debias 的新型性别去偏置方法,可以在不干扰语义的情况下消除词向量中的偏见,并可以改变其相邻向量的空间分布,从而实现无偏置设置,并可用于核指消解等下游应用任务。
Jun, 2020
该研究提出了一种新的度量标准来评估西班牙语和法语等语言中的词嵌入性别偏见,并进一步证明了双语词嵌入与英文词嵌入存在性别偏见的一致性。同时作者还提供了一种新的方法用于缓解这种偏见。实验结果表明这些方法有效地减少了性别偏见,同时也保持了嵌入向量的实用性。
Sep, 2019
研究表明,预训练词嵌入可能会的继承训练数据的性别偏见,并探究这种偏见如何影响职业分类任务。该文案例研究发现,传统的去偏方法可能会导致下游分类器的偏见恶化,但我们提出了一种相对较小的调整方法来同时减少偏见并保持高分类精度。
Aug, 2019
通过 siamese auto-encoder 和 adapted gradient reversal layer 的方法,我们提出了一种注意 semantic latent 信息和 gender latent 信息的词向量去偏见化的方法,同时减小语义信息损失,显著优于现有的去偏见化方法,并适用于人工语料库的下游 NLP 任务。
Apr, 2020
本文提出使用词向量以减少神经机器翻译中性别偏见的方法并应用于 Transformer 翻译结构中,通过评估在 WMT 英西标准测试上的结果,展示出一定的性能提高和在职业测试集上消除基线系统已存在的偏见。
Jan, 2019
本研究使用 Word Embeddings Association Test (WEAT)、Clustering 和 Sentence Embeddings Association Test (SEAT) 等方法,衡量荷兰语词嵌入中的性别偏见,并使用 Hard-Debias 和 Sent-Debias 调控方法,探索性别偏见对下游任务的影响。结果表明,传统和上下文嵌入中存在性别偏见,研究人员提供了翻译荷兰语数据集和减轻偏误的嵌入。
Oct, 2020
本研究探讨了文本话语中的性别偏见现象,评估了现有去偏置模型的实际效果,认为现有去偏置方法虽然在表面上达到了降低偏见的效果,但实际上却只是掩盖了偏见,并认为现有技术不足以构建性别中性的计算模型。
Mar, 2019