Jul, 2024

基于错误学习的土著语言翻译

TL;DR通过大型语言模型,本文提出了改进极低资源的土著语翻译的技术,采用了有限数量的平行翻译示例的数据存储,GPT-3.5等LLMs的内在能力以及词级翻译词典。我们利用LLMs和上下文学习技术作为极低资源语言的通用翻译器,基于LLMs的语言编译器假设它们可以内化语法结构以实现准确翻译。我们介绍了三种技术:带检索上下文的KNNPrompting、思维链式提示和来自错误的学习,其中最后一种方法解决了过往错误。评估结果表明,即使有限的文集,当与适当的提示搭配时,LLMs可以有效地翻译极低资源语言。