ACLFeb, 2024
低资源语言的机器翻译性能预测:领域相似性的作用
Predicting Machine Translation Performance on Low-Resource Languages: The Role of Domain Similarity
Eric Khiu, Hasti Toossi, David Anugraha, Jinyu Liu, Jiaxu Li...
TL;DR对于低资源语言(LRLs)来说,微调和测试多语言大型语言模型是昂贵和具有挑战性的。我们调查了微调语料库的大小、微调和测试语料库之间的领域相似性以及源语言和目标语言之间的语言相似性对模型性能的影响,结果表明领域相似性对机器翻译模型性能的预测有最重要的影响。