Feb, 2024

基于词典的形态学感知数据增强技术用于机器翻译低资源语种

TL;DR我们提出了一种依赖于词法 - 句法信息和双语词典以及少量种子并行数据来合成并行数据的策略,该方法在 14 种语言中(28 个英语 <->X 对)的实验中展示了性能的一致提升。