Jan, 2024

处理低资源语言时的机器翻译误称性别与假设性别

TL;DR本章节主要关注低资源语言背景下机器翻译中与性别相关的错误。通过对本土语言孟加拉语作为低资源语言的案例研究,阐述了当源文本中没有提供性别信息时,在与高资源英语之间的翻译中如何推测和假设性别,并讨论了这种错误导致的后殖民主义和社会影响,最后讨论了提高语言代表性的潜在解决方案。