面向英阿语的性别感知口语翻译
研究了语音翻译中存在的性别偏见问题,并基于英意 / 英法语言方向比较了级联与端到端技术,着重于探究如何利用音频信息来解决自然语言中的性别偏见问题。
Jun, 2020
本研究探讨无需转录的直接语音翻译模型在性别翻译方面的性别偏见及其潜在危害,并比较不同方法通知模型说话人性别信息的效果,结果表明性别感知模型相比于无性别感知模型在性别标记词的翻译准确率上可提高 30 个百分点,同时保证总体翻译质量。
Dec, 2020
本文研究了机器偏见和性别偏见,使用性别中性语言对 Google 翻译进行了实验,结果显示翻译的默认性别更偏向于男性,特别是在 STEM 领域中,这种偏见程度远超实际分布,因此需要对当前的统计翻译工具进行偏误纠正。
Sep, 2018
针对多语言机器翻译模型中明显的性别偏见问题,提出了一种新的缓解方法,Gender-Aware Contrastive Learning,通过伪标签在编码器嵌入中编码性别信息来提高性别准确度并改善其他目标语言的性别准确度。
May, 2023
通过与 GPT-4 模型比较,我们通过广泛的手动分析实证揭示了当前机器翻译系统在生成性别中立翻译时的固有限制,并为提示中立性所涉及的潜力和挑战提供了有价值的见解。
Feb, 2024
本章检查了机器翻译在持续性别偏见方面的作用,强调了跨语言环境和统计依赖性所带来的挑战。提供了与传统神经机器翻译方法和作为机器翻译系统的生成式预训练变压器模型相关的现有研究的全面概述。通过在英意翻译环境中使用 ChatGPT(基于 GPT-3.5)的实验,进一步评估了 ChatGPT 目前解决性别偏见的能力。研究结果强调了在机器翻译系统中减少偏见的发展的持续需求,并强调了在语言技术中培养公平和包容的重要性。
Jan, 2024
本文讨论性别中立翻译在机器翻译中的应用,并倡导其采用,以解决机器翻译模型延续性别偏见和歧视的问题。作者回顾了有关性别中立语言的相关机构指南,提出了性别中立翻译的策略和使用场景,并探讨了机器翻译中实施性别中立翻译的主要技术挑战。全文重点讨论了英语到意大利语的翻译问题,以代表性别标记规则不同的语言转换难题。
Jan, 2023
本文提出了一种将显式词级别的性别标记融入 NMT 中的方案,并探讨了在确定性别特征来源以及在目标语言中实现类似非二元词汇变化的情况下的性别标记控制翻译。该文发现了一些现有方法可能出现性别特征推广至句子中的多个实体,并提出了有效的替代方案,包括标记共指适应数据。
Oct, 2020
机器翻译在质量和应用方面不断取得进步,然而无意中传递性别偏见仍然是一个重大问题。为了弥补这一缺口,我们介绍了 GATE X-E,它是 GATE 语料库的扩展,包含了从土耳其语、匈牙利语、芬兰语和波斯语翻译成英语的人工翻译,并针对每种可能的性别解释提供了女性、男性和中性变体。我们还呈现了一个基于 GPT-3.5 Turbo 的英语性别重写解决方案,并利用 GATE X-E 对其进行了评估。我们开放源代码以鼓励进一步研究性别去偏见。
Nov, 2023