May, 2022

低资源情况下数据增强用于处理低频词问题的锡兰 - 英文神经机器翻译

TL;DR介绍了一种基于词和短语替换的数据增强技术,能够同时考虑到 Out-of-Vocabulary 问题的两种类型,语法和语义约束,从而提高了低资源语言对的机器翻译质量。