神经机器翻译编解码模型的校准

Mar, 2019

Calibration of Encoder Decoder Models for Neural Machine Translation

Aviral Kumar, Sunita Sarawagi

TL;DR本文研究了几种基于注意力编码器-解码器模型的最新神经机器翻译(NMT)系统的校准。我们表明，大多数现代NMT模型即使在给定真正的先前标记的情况下，其校准水平也惊人地失准。探讨了失误的两个原因：EOS和注意力不确定性的严重失校。基于这些信号，我们设计了重新校准方法，并展示了提高的准确性、更好的序列级校准和更直观的beam-search结果。

Abstract

We study the calibration of several state of the art neural machine translation(NMT) systems built on attention-based encoder-decoder models