May, 2024

关于非自回归翻译中的信息冗余

TL;DR在这项研究中,我们重新审视了最近提出的全非自回归翻译模型中的多模态问题,并揭示了这些先进模型引入了其他类型的信息冗余错误,无法由传统指标 - 连续重复比率来衡量。通过手动注释非自回归翻译模型的输出,我们确定了与词汇和重新排序的多模式问题相符合的两种信息冗余错误。鉴于人工注释的时间消耗和劳动强度,我们提出了自动度量标准来评估这两种冗余错误类型。我们的度量标准可以让未来的研究评估新方法,并对其有效性有一个更全面的理解。