探究自动翻译在无歧义性别情况下发生错误的原因

EMNLPApr, 2021

探究自动翻译在无歧义性别情况下发生错误的原因

Investigating Failures of Automatic Translation in the Case of Unambiguous Gender

Adithya Renduchintala, Adina Williams

TL;DR研究表明，使用基于 Transformer 的神经机器翻译模型在翻译一个没有对名词进行性别标注的语言时存在一些固有的性别标注错误。该论文提出了一个评估方案和数据集，以便在不同语言和句法结构的语境下准确评估基于 Transformer 的 NMT 模型的性别标注翻译能力。

Abstract

transformer based models are the modern work horses for neural machine translation (NMT), reaching state of the art across several benchmarks. Despite their impressive accuracy, we observe a systemic and rudimentary class of errors made by →

transformer based models neural machine translation gender morphology evaluation scheme dataset

发现论文，激发创造

神经机器翻译在不做特别处理时不能正确翻译性别指代

本文提出了一种将显式词级别的性别标记融入 NMT 中的方案，并探讨了在确定性别特征来源以及在目标语言中实现类似非二元词汇变化的情况下的性别标记控制翻译。该文发现了一些现有方法可能出现性别特征推广至句子中的多个实体，并提出了有效的替代方案，包括标记共指适应数据。

Oct, 2020

本文探讨了如何通过翻译相关的背景句子，指导神经机器翻译系统上下文修正性别偏见后，显著提高其翻译性能；同时提出一种新的度量标准来评估大型预训练模型在使用上下文进行翻译时修正偏见的敏感度。

May, 2022

使用语法性别暗示进行机器翻译偏见评估：性别落地还是偏见施加

神经机器翻译（NMT）模型是机器翻译的先进技术，但这些模型被发现存在各种社会偏见，尤其是性别偏见。本文以印地语作为源语言，构建了两组性别特定的句子集（OTSC-Hindi 和 WinoMT-Hindi），用于自动评估不同的印地 - 英文（HI-EN）NMT 系统是否存在性别偏见。本研究强调了设计此类外在偏见评估数据集时考虑语言特性的重要性。

Nov, 2023

利用扰动自动识别机器翻译中的性别问题

该研究利用神经网络方法实现自然语言翻译，挖掘实际数据中存在性别语言模型与相关问题，发布评估基准用于研究性别语言模型的特性和潜在影响。

Apr, 2020

机器翻译中的性别偏见与大型语言模型时代

本章检查了机器翻译在持续性别偏见方面的作用，强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT（基于 GPT-3.5）的实验，进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求，并强调了在语言技术中培养公平和包容的重要性。

Jan, 2024

机器翻译中性别偏见的评估

本研究利用两个共指解析数据集，通过 8 种有语法性别的目标语言中的形态分析，第一次提出了机器翻译中性别偏见的挑战集和评估协议，并发现四个流行的工业机器翻译系统和两个最新的学术机器翻译模型在所有测试的目标语言上都容易出现性别偏见翻译错误。

Jun, 2019

优先选择翻译更为准确的性别翻译策略

本研究通过调整推理过程，使用性别特征和应用性别约束条件，改善 $nbest$ 列表的性别多样性，解决了神经机器翻译中的性别偏见问题，最终权衡这些技术可以在不需要额外的双语数据或额外的 NMT 模型的情况下获得显着的 WinoMT 准确度提高.

Apr, 2021

别忽视语法性别：针对印度 - 英语机器翻译的偏见评估

神经机器翻译中存在性别偏见，而评估基准主要关注英语作为源语言的翻译，我们提出了为源语言中的语法性别标记量身定制偏见评估测试集的方法，以确定 NMT 模型是否能通过语法性别线索来区分性别。

Nov, 2023

使用目标性别标注缓解机器翻译中的性别偏见

在机器翻译中，当源语言句子未提供主语的性别信息时，系统往往选择最常见的翻译选项，从而可能加剧某些群体和人员的偏见和边缘化。为减少对性别刻板印象的依赖，本论文提出使用包含主语性别信息的单词级别注释训练机器翻译系统的方法，实验结果表明，这可使机器翻译系统在五种语言对上的 WinoMT 测试集上准确度提高高达 25.8 个百分点。

Oct, 2020

使用反事实数据生成减少机器翻译中的性别偏见

最近的神经方法在神经机器翻译（NMT）系统质量方面取得了重大进展。然而，这些系统经常会产生具有不准确性别的翻译，这可以追溯到训练数据中的偏见。Saunders 和 Byrne 通过使用一个包含平衡性别职业词的手工制作数据集来解决这个问题。通过使用这个数据来微调现有的 NMT 模型，他们证明了性别偏见可以显著减轻，尽管这会导致由于灾难性遗忘而降低翻译质量。然而，我们发现，简单地补充手工制作的数据集与基础模型训练语料库的随机样本就足以显著减少灾难性遗忘。我们还提出了一种新颖的领域自适应技术，利用 Zmigrod 等人提出的反事实数据生成技术创建的领域内数据，在不显著降低翻译质量的情况下进一步提高 WinoMT 挑战测试集的准确性。我们展示了它在从英语到三种形态丰富的语言（法语、西班牙语和意大利语）的 NMT 系统中的有效性。相关数据集和代码将在 Github 上提供。

Nov, 2023

探究自动翻译 在无歧义性别情况下发生错误的原因

探究自动翻译在无歧义性别情况下发生错误的原因