May, 2022

一种自适应混合蒸馏方法用于非自回归生成

TL;DR本文提出了一种基于自适应学习的混合蒸馏算法,用于进一步提高 BANG 生成质量。实验证明该方法有效性,并且不会影响推理延迟,相比 BANG 可以显著提高 BLEU 分数,在自回归生成方法方面还可获得超过7倍的加速。