May, 2022

为下一个千种语言构建机器翻译系统

TL;DR描述了我们构建跨越1000个语言翻译的实用机器翻译系统的努力,包括构建干净的数据集、使用监督并行数据训练的大规模多语言模型和单语数据集以及研究评估语言的限制和误差模式。