Nov, 2023

利用大语言模型提升机器翻译:基于合作解码的初步研究

TL;DR基于编码器-解码器框架的当代翻译引擎发展迅猛,而大型语言模型的出现破坏了它们的地位,提供了实现更优翻译质量的潜力。因此,了解LLMs是如何在何种场景下胜过传统NMT系统,以及如何发挥其优势,变得至关重要。本文首先进行了全面分析,评估了各种商业NMT系统和面向机器翻译的LLMs的优势和局限性。发现NMT系统和面向机器翻译的LLMs都不能有效解决所有翻译问题,但面向机器翻译的LLMs可以作为NMT系统的有希望的补充。基于这些发现,我们探索了混合方法,并提出了合作解码(CoDec)将NMT系统视为预翻译模型,将面向机器翻译的LLMs视为处理NMT系统无法覆盖的复杂场景的补充解决方案。在WMT22测试集和新收集的WebCrawl测试集上的结果表明,CoDec的有效性和效率,突出了将NMT系统与面向机器翻译的LLMs相结合作为强大解决方案的潜力。