May, 2023

单语数据何时对多语言翻译有帮助:领域和模型规模的作用

TL;DR通过实验研究了多种语言机器翻译在不同数据条件和模型尺度下,去噪自编码器和回译技术对多种语言机器翻译的影响、以及单语数据在多种语言机器翻译中的作用和数据规模对机器翻译的影响等问题。结果发现单语数据总体有益于机器翻译,但在小型模型中对领域不匹配,BT 对相似的平行,单语和测试数据来源是有益的,但在其他情况下会有不利影响,DAE 相对于以前报告的效果不如。规模永远是关键。