EMNLPAug, 2019

论神经机器翻译中的搜索误差和模型误差:难道你的舌头被猫抓走了吗?

TL;DR本文以神经序列模型为基础,结合 Beam Search 和 Depth-first Search 算法,提出了一种精确的推理过程,并使用该过程在 WMT15 英德句子翻译测试集上找到了 Transformer 模型的全局最佳模型分数,揭示神经模型在适当考虑翻译准确性方面存在严重问题。论文发现,Beam Search 算法无法在大多数情况下找到全局最佳模型分数,很多情况下模型更倾向于返回空白翻译结果,这源自于神经模型中天然的对短句子的偏好。