Oct, 2022

双向阿姆哈拉语-英语神经机器翻译的标准化效果

TL;DR本文介绍了第一个相对较大规模的阿姆哈拉语-英语双语平行语句数据集,利用这些数据,通过微调现有的Facebook M2M100预训练模型,建立了双向阿姆哈拉语-英语翻译模型,在阿姆哈拉语-英语翻译和英语-阿姆哈拉语翻译中均达到了较高的BLEU得分,此外,本文还探讨了阿姆哈拉语同音字范式化对机器翻译的影响。结果表明,阿姆哈拉语同音字的范式化可以提高双向翻译模型的翻译性能。