Apr, 2024

从 LLM 到 NMT:借助 Claude 推动低资源机器翻译的发展

TL;DRAnthropic 在 2024 年 3 月发布的大型语言模型 Claude 3 Opus 在机器翻译方面表现出比其他语言模型更强的能力。虽然我们发现 Claude 在 FLORES-200 上存在数据污染的证据,但我们整理了新的基准数据,证实了 Claude 在对英语进行低资源机器翻译方面的有效性。我们发现 Claude 具有显著的资源效率 - 翻译模型的质量程度取决于语言对的资源水平。最后,我们展示了 LLM 翻译的进展可以被压缩到传统的神经机器翻译 (NMT) 模型中。通过使用 Claude 生成合成数据,我们证明了知识蒸馏在约鲁巴语 - 英语翻译方面推进了最新技术,达到或超过了 NLLB-54B 和 Google 翻译等强基线。