通过对抗学习缓解机器翻译中的性别偏见

Mar, 2022

通过对抗学习缓解机器翻译中的性别偏见

Mitigating Gender Bias in Machine Translation through Adversarial Learning

Eve Fleisig, Christiane Fellbaum

TL;DR本文介绍了一种基于对抗学习的机器翻译性别偏见缓解框架，该框架通过在预训练的大型语言模型上微调网络目标，以及从数据自身推断保护变量的任务中开发措施，实现了对机器翻译中的性别偏见的缓解，提高了男女实体翻译质量的差异。

Abstract

machine translation and other nlp systems often contain significant biases regarding sensitive attributes, such as gender or race, that wo

machine translation nlp systems biases adversarial learning gender bias

发现论文，激发创造

基于对抗学习减轻神经对话生成中的性别偏见

本文提出了基于对抗学习的、旨在降低对话系统中性别歧视的新框架 Debiased-Chat，并在两个真实的对话数据集上进行了广泛的实验，结果表明该框架明显降低了对话模型的性别偏见，同时保持了响应质量。

Sep, 2020

领域适应问题中的神经机器翻译性别偏见减少

翻译系统中存在的性别偏见问题影响翻译质量，作者使用许多小规模相似数据的迁移学习替代了传统的样本平衡方法，并使用弹性权重共享和基于网络重叠的方法解决了迁移学习中的遗忘问题。最后，作者构建了优于其他系统的词网重新评分方案来解决性别偏见问题。

Apr, 2020

目标无关的性别感知对比学习在多语言机器翻译中缓解偏见

针对多语言机器翻译模型中明显的性别偏见问题，提出了一种新的缓解方法，Gender-Aware Contrastive Learning，通过伪标签在编码器嵌入中编码性别信息来提高性别准确度并改善其他目标语言的性别准确度。

May, 2023

用对抗学习缓解不必要的偏见

本文提出了通过引入变量以及同时训练预测器和对手的方式来缓解训练数据中存在的偏见问题，在不同定义的公平性与多种基于梯度的学习模型，包括回归和分类任务中均具有广泛适用性的公平性缓解方法。

Jan, 2018

大型语言模型中的性别偏见煽动与缓解之学习

自动检测大型语言模型（如 ChatGPT 和 GPT-4）潜在性别偏见的研究，提出了一种自动生成测试用例的方法，并通过这些测试用例来减轻模型偏见，从而实现更公正的回复。

Oct, 2023

使用反事实数据生成减少机器翻译中的性别偏见

最近的神经方法在神经机器翻译（NMT）系统质量方面取得了重大进展。然而，这些系统经常会产生具有不准确性别的翻译，这可以追溯到训练数据中的偏见。Saunders 和 Byrne 通过使用一个包含平衡性别职业词的手工制作数据集来解决这个问题。通过使用这个数据来微调现有的 NMT 模型，他们证明了性别偏见可以显著减轻，尽管这会导致由于灾难性遗忘而降低翻译质量。然而，我们发现，简单地补充手工制作的数据集与基础模型训练语料库的随机样本就足以显著减少灾难性遗忘。我们还提出了一种新颖的领域自适应技术，利用 Zmigrod 等人提出的反事实数据生成技术创建的领域内数据，在不显著降低翻译质量的情况下进一步提高 WinoMT 挑战测试集的准确性。我们展示了它在从英语到三种形态丰富的语言（法语、西班牙语和意大利语）的 NMT 系统中的有效性。相关数据集和代码将在 Github 上提供。

Nov, 2023

机器翻译中的性别偏见与大型语言模型时代

本章检查了机器翻译在持续性别偏见方面的作用，强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT（基于 GPT-3.5）的实验，进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求，并强调了在语言技术中培养公平和包容的重要性。

Jan, 2024

利用词嵌入技术消除神经机器翻译中的性别偏差

本文提出使用词向量以减少神经机器翻译中性别偏见的方法并应用于 Transformer 翻译结构中，通过评估在 WMT 英西标准测试上的结果，展示出一定的性能提高和在职业测试集上消除基线系统已存在的偏见。

Jan, 2019

自然语言处理中减轻性别偏见：文献综述

本文回顾了当今关于识别和减轻 NLP 中的性别偏置的研究，并分析了四种代表性偏置基础上的性别偏见和认识其方法，同时探讨了现有性别去偏方法的优缺点和未来的研究。

Jun, 2019

模型适应的去偏算法

提出了一种用于检测和减轻语言模型中性别偏见的新方法，通过因果分析确定了问题模型组件，发现中上部前馈层最容易传递偏见，根据分析结果通过线性投影来改进模型，该方法（DAMA）显著减少了偏见，并保持了模型在下游任务上的性能。

Oct, 2023