Feb, 2024

GATE X-E:弱性别语言的性别平等翻译挑战集

TL;DR神经机器翻译在质量和应用方面不断改进,但性别偏见的无意中延续仍是一个重要问题,尤其缺乏评估和减轻策略的基准,本研究通过引入 GATE X-E 扩展了 GATE 语料库,提供了从土耳其语、匈牙利语、芬兰语和波斯语到英语的人工翻译及其女性化、男性化和中性化变体,开发了基于 GPT-4 的翻译性别重写解决方案,并使用 GATE X-E 进行评估,倡导进一步研究性别去偏见问题。