Nov, 2023

多枢轴集成和大规模多语言机器翻译模型的研究

TL;DR大规模多语言机器翻译模型在一种模型中翻译大量语言,但在低资源和非常低资源的翻译方向上的性能有限。在这篇论文中,我们重新审视通过多个语言进行枢轴翻译的方法。我们提出了 MaxEns 作为一种组合策略,偏向于最自信的预测,以减少翻译中出现的幻觉问题。通过在 FLORES 基准测试中评估不同策略,我们证明 MaxEns 提高低资源语言的翻译质量,同时减少翻译中的幻觉,相对于直接翻译和平均方法。平均而言,多枢轴策略仍然落后于使用英语作为单个枢轴语言,这引发了如何为特定翻译方向确定最佳枢轴策略的问题。