Oct, 2021

通过混合训练来提高非自回归生成

TL;DR本文介绍了一种基于预训练 transformer 模型的非自回归生成模型,并提出了一种名为 MIST 的迭代训练方法,无需在推断阶段牺牲推断速度即可获得更好的性能,在问题生成、摘要和释义生成等三个方面取得了最新的最好效果。