ACLMay, 2021

蒸馏数据复杂度如何影响非自回归机器翻译的质量和置信度?

TL;DR研究表明,非自回归模型在机器翻译中表现良好,但由于其需要从自回归模型中提炼知识,受到了一定的限制。本文针对这个问题进行了研究,通过实验发现,虽然减少词汇多样性和减少重新排序复杂性都有助于 NAR 学习更好的源和目标之间的对齐关系,从而提高翻译质量,但是词汇多样性是提炼增加模型置信度的主要原因,并会对不同的 NAR 模型产生不同的影响。