Nov, 2020

领域特定的僧伽罗语 - 英语 - 泰米尔语统计机器翻译的数据增强和术语整合

TL;DR本文主要研究针对机器翻译中低资源语种的词汇缺失问题,提出了基于双语词表整合的方法和基于数据增强技术的方法,通过以词干和格标注扩充双语词表词汇以提高 SMT 的准确性,在 Sinhala-English 机器翻译任务中取得了改善。