COLINGSep, 2022

极其罕见但严重的最小删除诱导的神经机器翻译错误:对中文和英文的实证研究

TL;DR本文研究了基于字符的模型在源文本最小删除下对英汉及汉英领域神经机器翻译中罕见但严重错误的诱导作用,并发现单个字符的删除会导致严重的翻译错误,同时比较了删除单个字符和单个词的结果,发现训练数据的大小对这些最小扰动引起的病态情况的数量和类型有显著的影响。结果表明,删除单词比删除字符对整体的翻译结果更为具有破坏性,但在删除字符时更易出现某些错误,语言方向也会影响效果。