Jun, 2019

低资源翻译的广义数据增强

TL;DR本论文提出了一种在低资源机器翻译中进行数据增强的通用框架,该框架不仅使用目标端单语数据,还通过相关高资源语言进行桥接,通过在两个步骤中使用词典和修改无监督机器翻译框架,将高资源数据转换为低资源语言,实验证明该方法在极低的资源条件下,与受监督背景转换基线相比,可将翻译质量提高1.5到8个BLEU点。