Dec, 2022

Lego-MT: 面向大规模多语机器翻译的可拆卸模型

TL;DR本文提出了一种名为 Lego-MT 的多向分支神经机器翻译模型,通过局部化训练,将不同的分支映射到一个统一的空间中,达到高效、可分离的效果,并在收集的包含 7 个语言中心数据的大型开源翻译基准测试中,取得了超过 4 个 BLEU 的提升,优于 M2M-100 模型。