Oct, 2021
通过混合训练来提高非自回归生成
Improving Non-autoregressive Generation with Mixup Training
Ting Jiang, Shaohan Huang, Zihan Zhang, Deqing Wang, Fuzhen Zhuang...
TL;DR本文介绍了一种基于预训练 transformer 模型的非自回归生成模型,并提出了一种名为 MIST 的迭代训练方法,无需在推断阶段牺牲推断速度即可获得更好的性能,在问题生成、摘要和释义生成等三个方面取得了最新的最好效果。