个性化机器翻译:保留原作者特点
本文提出了一种简单而参数高效的自适应技术,通过适应输出 softmax 的偏差来适应机器翻译系统的每个特定用户,从而改善翻译准确性和更好地反映说话者特点在目标文本中。
May, 2018
本章检查了机器翻译在持续性别偏见方面的作用,强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT(基于 GPT-3.5)的实验,进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求,并强调了在语言技术中培养公平和包容的重要性。
Jan, 2024
在机器翻译中,当源语言句子未提供主语的性别信息时,系统往往选择最常见的翻译选项,从而可能加剧某些群体和人员的偏见和边缘化。为减少对性别刻板印象的依赖,本论文提出使用包含主语性别信息的单词级别注释训练机器翻译系统的方法,实验结果表明,这可使机器翻译系统在五种语言对上的 WinoMT 测试集上准确度提高高达 25.8 个百分点。
Oct, 2020
在这篇论文中,我们专注于英土文学翻译,开发了考虑到译者文体特征的机器翻译模型,并通过手动对齐的作品来微调预训练的机器翻译模型。我们详细分析了手动和自动对齐、数据增强方法和语料库规模在翻译中的影响。我们提出了一种基于文体特征的方法来评估翻译输出的译者文体,证明通过将模型适应译者的文体,可以高度重现人类翻译者的文体。
Jul, 2023
本文研究了机器偏见和性别偏见,使用性别中性语言对 Google 翻译进行了实验,结果显示翻译的默认性别更偏向于男性,特别是在 STEM 领域中,这种偏见程度远超实际分布,因此需要对当前的统计翻译工具进行偏误纠正。
Sep, 2018
本研究评估了 Google Translate、DeepL 和 Modern MT 这三种在线翻译系统在性别翻译和偏见方面的表现,并发现这些系统在性别翻译方面存在不同程度的偏见。
Jun, 2023
研究表明,大规模语言模型虽然可以输出流畅的文本,但它们也捕捉到人类偏见。本文研究了面向开放式文本生成的几种大规模语言模型的人格特征和训练集,使用问卷设计了人格评估,并用零 - shot 分类器将文本回答分类到可量化的特征中,研究了可以改变这些人格特征的方法。
Apr, 2022