Apr, 2020

非自回归机器翻译的对齐交叉熵

TL;DR本文提出了一种新的针对非自回归机器翻译模型的训练方法 aligned cross entropy (AXE),该方法通过使用可微动态规划来实现最佳单调对齐,明显改善了条件掩码语言模型在主要 WMT 基准测试中的表现并创下了非自回归模型的新记录。