ACLMay, 2024

从解码目标的角度理解和解决翻译结果不足的问题

TL;DR神经机器翻译 (NMT) 在过去几年取得了显著进展,但仍存在两个具有挑战性的问题,即欠翻译和过翻译。本文从解码目标的角度深入分析了 NMT 中欠翻译的根本原因,并提出了使用预测句子结束标记的置信度作为欠翻译检测器的方法,通过增强基于置信度的惩罚来纠正欠翻译的候选翻译,实验证明该方法可以准确地检测和纠正欠翻译的输出,对其他正确翻译的影响较小。