EMNLPSep, 2018

MTNT:噪声文本机器翻译测试平台

TL;DR本文提出了一个用于噪声文本机器翻译的基准数据集(MTNT),包括 Reddit 上的嘈杂评论和专业翻译。作者们通过定性和定量的方法检验了该数据集中所包含的各类噪声,并证明了现有机器翻译模型在应对各种噪声方面的表现不佳,这表明 MTNT 可以为处理 MT 中的噪声文本提供一个吸引人的测试平台。