个性化机器翻译：保留原作者特点

ACLOct, 2016

个性化机器翻译：保留原作者特点

Personalized Machine Translation: Preserving Original Author Traits

Ella Rabinovich, Shachar Mirkin, Raj Nath Patel, Lucia Specia, Shuly Wintner

TL;DR研究作者的性别在自然语言与翻译中所表现的个性化特征以及提出了简单的领域自适应技术来保持翻译的原始性别特征而不影响翻译质量。

Abstract

The language that we produce reflects our personality, and various personal and demographic characteristics can be detected in natural language texts. We focus on one particular personal trait of the author,

gender natural language translation personality domain-adaptation

发现论文，激发创造

个性化神经机器翻译的极端适应性

本文提出了一种简单而参数高效的自适应技术，通过适应输出 softmax 的偏差来适应机器翻译系统的每个特定用户，从而改善翻译准确性和更好地反映说话者特点在目标文本中。

May, 2018

机器翻译中的性别偏见与大型语言模型时代

本章检查了机器翻译在持续性别偏见方面的作用，强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT（基于 GPT-3.5）的实验，进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求，并强调了在语言技术中培养公平和包容的重要性。

Jan, 2024

使用目标性别标注缓解机器翻译中的性别偏见

在机器翻译中，当源语言句子未提供主语的性别信息时，系统往往选择最常见的翻译选项，从而可能加剧某些群体和人员的偏见和边缘化。为减少对性别刻板印象的依赖，本论文提出使用包含主语性别信息的单词级别注释训练机器翻译系统的方法，实验结果表明，这可使机器翻译系统在五种语言对上的 WinoMT 测试集上准确度提高高达 25.8 个百分点。

Oct, 2020

将人类翻译风格纳入英土文学机器翻译

在这篇论文中，我们专注于英土文学翻译，开发了考虑到译者文体特征的机器翻译模型，并通过手动对齐的作品来微调预训练的机器翻译模型。我们详细分析了手动和自动对齐、数据增强方法和语料库规模在翻译中的影响。我们提出了一种基于文体特征的方法来评估翻译输出的译者文体，证明通过将模型适应译者的文体，可以高度重现人类翻译者的文体。

Jul, 2023

利用扰动自动识别机器翻译中的性别问题

该研究利用神经网络方法实现自然语言翻译，挖掘实际数据中存在性别语言模型与相关问题，发布评估基准用于研究性别语言模型的特性和潜在影响。

Apr, 2020

评估机器翻译中的性别偏见 -- 以 Google 翻译为例

本文研究了机器偏见和性别偏见，使用性别中性语言对 Google 翻译进行了实验，结果显示翻译的默认性别更偏向于男性，特别是在 STEM 领域中，这种偏见程度远超实际分布，因此需要对当前的统计翻译工具进行偏误纠正。

Sep, 2018

好，但并不总是公平：对三个商用机器翻译系统性别偏见的评估

本研究评估了 Google Translate、DeepL 和 Modern MT 这三种在线翻译系统在性别翻译和偏见方面的表现，并发现这些系统在性别翻译方面存在不同程度的偏见。

Jun, 2023

神经机器翻译中实现性别准确性

本研究将性别信息加入神经机器翻译系统中，旨在提高语言翻译的准确性。实验结果表明，对于某些语言对，加入性别特征显著提高了翻译质量。

Sep, 2019

机器翻译中的性别偏见

通过批判性地审视当前有关 MT 偏见的概念化，总结以往的性别偏见分析，讨论已提出的缓解策略，并指向未来工作的潜在方向，提出了一个统一的框架以便于未来研究。

Apr, 2021

AI 人格化：评估语言模型的人格特质

研究表明，大规模语言模型虽然可以输出流畅的文本，但它们也捕捉到人类偏见。本文研究了面向开放式文本生成的几种大规模语言模型的人格特征和训练集，使用问卷设计了人格评估，并用零 - shot 分类器将文本回答分类到可量化的特征中，研究了可以改变这些人格特征的方法。

Apr, 2022