Nov, 2017
词、子词或字符?汉英 NMT 中粒度的实证研究
Word, Subword or Character? An Empirical Study of Granularity in Chinese-English NMT
Yining Wang, Long Zhou, Jiajun Zhang, Chengqing Zong
TL;DR本文对多个使用不同类型划分的翻译模型在中英翻译任务中进行了探究和比较,发现在中文翻译到英文的任务中,使用子词模型效果最好。在英文翻译到中文的任务中,使用混合词形式模型最优。此外,使用 混合_BPE 方法在中文翻译到英文的任务中取得了最佳效果。