May, 2022

为下一个千种语言构建机器翻译系统

TL;DR描述了我们构建跨越 1000 个语言翻译的实用机器翻译系统的努力,包括构建干净的数据集、使用监督并行数据训练的大规模多语言模型和单语数据集以及研究评估语言的限制和误差模式。