May, 2022
低资源情况下数据增强用于处理低频词问题的锡兰 - 英文神经机器翻译
Data Augmentation to Address Out-of-Vocabulary Problem in Low-Resource Sinhala-English Neural Machine Translation
Aloka Fernando, Surangika Ranathunga
TL;DR介绍了一种基于词和短语替换的数据增强技术,能够同时考虑到 Out-of-Vocabulary 问题的两种类型,语法和语义约束,从而提高了低资源语言对的机器翻译质量。