BriefGPT.xyz
Jun, 2019
低资源翻译的广义数据增强
Generalized Data Augmentation for Low-Resource Translation
HTML
PDF
Mengzhou Xia, Xiang Kong, Antonios Anastasopoulos, Graham Neubig
TL;DR
本论文提出了一种在低资源机器翻译中进行数据增强的通用框架,该框架不仅使用目标端单语数据,还通过相关高资源语言进行桥接,通过在两个步骤中使用词典和修改无监督机器翻译框架,将高资源数据转换为低资源语言,实验证明该方法在极低的资源条件下,与受监督背景转换基线相比,可将翻译质量提高1.5到8个BLEU点。
Abstract
Translation to or from
low-resource languages
LRLs poses challenges for
machine translation
in terms of both adequacy and fluency.
data augmentat
→