May, 2024

基于LLM的有规则机器翻译方法用于低/无资源语言

TL;DR我们提出了一种新的机器翻译范式,特别适用于无资源语言(即没有任何公开可用的双语或单语语料库):LLM辅助的基于规则的机器翻译。利用这种范式,我们设计了第一个面向语言教育/振兴的机器翻译器,针对Owens Valley Paiute语言,这是一种濒危的美洲原住民语言,几乎没有公开可用的数据。我们对翻译器的多个组件进行了详细评估:基于规则的句子构建器、OVP到英语的翻译器和英语到OVP的翻译器。我们还讨论了这种范式的潜力、限制以及它所打开的未来研究的许多途径。