Oct, 2022

规模化的多语言机器翻译中的毒性问题

TL;DR本文调查了机器翻译中的一种关键性错误:加入有毒信息。作者评估了一个大型数据集的翻译质量,并发现了加入有毒信息的范围和原因。作者认为,为了减少这些错误,需要修改训练数据,减少幻觉,检查不稳定的翻译。