Mar, 2019

神经机器翻译编解码模型的校准

TL;DR本文研究了几种基于注意力编码器-解码器模型的最新神经机器翻译(NMT)系统的校准。我们表明,大多数现代NMT模型即使在给定真正的先前标记的情况下,其校准水平也惊人地失准。 探讨了失误的两个原因:EOS和注意力不确定性的严重失校。 基于这些信号,我们设计了重新校准方法,并展示了提高的准确性、更好的序列级校准和更直观的beam-search结果。