Nov, 2019

神经机器翻译的领域鲁棒性

TL;DR本文研究了机器翻译模型在未知领域中的性能表现,发现在未知领域中,统计机器翻译(SMT)和神经机器翻译(NMT)系统存在不同的问题:SMT系统通常足够但不流利,而NMT系统流利但不足够。本文发现,NMT系统出现的“幻觉”现象是造成低域稳健性的主要原因,研究并比较了有关提高NMT系统稳健性的方法,实验结果表明,这些方法能够稍微提高NMT系统翻译的充分性,但对流畅性的提高较小。