Jan, 2020

神经机器翻译上的聚合语言词形分割

TL;DR本研究提出了一种基于形态学的单词分割方法,能够在训练时缩小词汇表的同时保留词结构中的语言和语义信息,以协助神经机器翻译,实验结果表明此方法能显著提高土耳其 - 英语和维吾尔 - 中文机器翻译任务的性能,降低数据稀疏性和语言复杂性。