通过相关语境来减轻神经机器翻译模型中的性别偏见：翻译系统对额外上下文的敏感度如何？

EMNLPMay, 2022

通过相关语境来减轻神经机器翻译模型中的性别偏见：翻译系统对额外上下文的敏感度如何？

How sensitive are translation systems to extra contexts? Mitigating gender bias in Neural Machine Translation models through relevant contexts

PDF

Shanya Sharma, Manan Dey, Koustuv Sinha

TL;DR本文探讨了如何通过翻译相关的背景句子，指导神经机器翻译系统上下文修正性别偏见后，显著提高其翻译性能；同时提出一种新的度量标准来评估大型预训练模型在使用上下文进行翻译时修正偏见的敏感度。

Abstract

neural machine translation systems built on top of Transformer-based architectures are routinely improving the state-of-the-art in translation quality according to word-overlap metrics. However, a growing number of studies also highlight the inherent →

neural machine translation transformer-based architectures gender bias inference contextual sentences

发现论文，激发创造

上下文是否有助于缓解神经机器翻译中的性别偏见？

神经机器翻译模型在其训练数据分布中往往会延续性别偏见。本文通过详细分析英语到德语的刻板职业翻译以及巴斯克语到西班牙语的非信息上下文翻译，检验了上下文感知模型对减轻此类偏见的作用。研究结果表明，虽然上下文感知模型可以显著增强女性术语的翻译准确性，但依然可能保持或放大性别偏见。这些结果凸显了神经机器翻译中对偏见减轻需要更精细方法的需求。

Jun, 2024

领域适应问题中的神经机器翻译性别偏见减少

翻译系统中存在的性别偏见问题影响翻译质量，作者使用许多小规模相似数据的迁移学习替代了传统的样本平衡方法，并使用弹性权重共享和基于网络重叠的方法解决了迁移学习中的遗忘问题。最后，作者构建了优于其他系统的词网重新评分方案来解决性别偏见问题。

Apr, 2020

机器翻译中的性别偏见与大型语言模型时代

本章检查了机器翻译在持续性别偏见方面的作用，强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT（基于 GPT-3.5）的实验，进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求，并强调了在语言技术中培养公平和包容的重要性。

Jan, 2024

使用语法性别暗示进行机器翻译偏见评估：性别落地还是偏见施加

神经机器翻译（NMT）模型是机器翻译的先进技术，但这些模型被发现存在各种社会偏见，尤其是性别偏见。本文以印地语作为源语言，构建了两组性别特定的句子集（OTSC-Hindi 和 WinoMT-Hindi），用于自动评估不同的印地 - 英文（HI-EN）NMT 系统是否存在性别偏见。本研究强调了设计此类外在偏见评估数据集时考虑语言特性的重要性。

Nov, 2023

使用反事实数据生成减少机器翻译中的性别偏见

最近的神经方法在神经机器翻译（NMT）系统质量方面取得了重大进展。然而，这些系统经常会产生具有不准确性别的翻译，这可以追溯到训练数据中的偏见。Saunders 和 Byrne 通过使用一个包含平衡性别职业词的手工制作数据集来解决这个问题。通过使用这个数据来微调现有的 NMT 模型，他们证明了性别偏见可以显著减轻，尽管这会导致由于灾难性遗忘而降低翻译质量。然而，我们发现，简单地补充手工制作的数据集与基础模型训练语料库的随机样本就足以显著减少灾难性遗忘。我们还提出了一种新颖的领域自适应技术，利用 Zmigrod 等人提出的反事实数据生成技术创建的领域内数据，在不显著降低翻译质量的情况下进一步提高 WinoMT 挑战测试集的准确性。我们展示了它在从英语到三种形态丰富的语言（法语、西班牙语和意大利语）的 NMT 系统中的有效性。相关数据集和代码将在 Github 上提供。

Nov, 2023

面向上下文的神经机器翻译学习

本文中，我们提出了一种新的学习算法，用于增进神经机器翻译模型对附加上下文的理解，通过使用多级成对排名损失函数，我们在基于 transformer 的大语境翻译系统中进行了评估，并通过与实际和随机语境下的性能对比表明，使用所提出的算法训练的模型对额外上下文的理解更敏感。

Mar, 2019

探究自动翻译在无歧义性别情况下发生错误的原因

研究表明，使用基于 Transformer 的神经机器翻译模型在翻译一个没有对名词进行性别标注的语言时存在一些固有的性别标注错误。该论文提出了一个评估方案和数据集，以便在不同语言和句法结构的语境下准确评估基于 Transformer 的 NMT 模型的性别标注翻译能力。

Apr, 2021

代词的故事：可解释性指导对公正指令调整机器翻译中的性别偏见缓解

探讨了细调指令模型在机器翻译中存在性别偏见的问题，并提出了基于少样本学习的易于实施且有效的偏见缓解解决方案，以实现更公平的翻译。

Oct, 2023

利用词嵌入技术消除神经机器翻译中的性别偏差

本文提出使用词向量以减少神经机器翻译中性别偏见的方法并应用于 Transformer 翻译结构中，通过评估在 WMT 英西标准测试上的结果，展示出一定的性能提高和在职业测试集上消除基线系统已存在的偏见。

Jan, 2019

上下文感知机器翻译中的上下文使用度测量与增加

本文介绍了一种新的度量模型使用上下文的方法，并提出了一种新的训练方法来增加上下文感知模型的使用率。实验证明，这种方法可以提高翻译质量和语义连贯性。

May, 2021