多语言到英语机器翻译工具、数据和预训练模型

Apr, 2021

多语言到英语机器翻译工具、数据和预训练模型

Many-to-English Machine Translation Tools, Data, and Pretrained Models

Thamme Gowda, Zhao Zhang, Chris A Mattmann, Jonathan May

TL;DR本文提出三种工具：MTData、NLCodec 和 RTG，设计一个能够从 500 种源语言翻译成英语的多语言神经机器翻译模型，支持语言种类很多，且模型容易下载和使用。

Abstract

While there are more than 7000 languages in the world, most translation research efforts have targeted a few high-resource languages. Commercial translation systems support only one hundred languages or fewer, and do not make these models available for transfer to low resource languages