Aug, 2024

低资源NMT的高质量数据增强:结合翻译记忆、生成对抗网络与过滤

TL;DR本研究解决了低资源语言翻译任务中数据集扩展的困难,提出了一种利用单语语料库和生成对抗网络(GAN)相结合的新方法,以增强训练数据并提高翻译质量。通过整合翻译记忆(TM)与NMT,并提出了一种新的过滤程序,该工作显著提高了合成句对的质量,为低资源NMT提供了有效的数据增强策略。