Oct, 2021

分层预测与深度监督的非自回归翻译

TL;DR本研究提出了 DSLP 模型,可以通过使用深度监督和层次预测训练非自回归 Transformer 以进行高效且高性能的机器翻译,实验结果表明,与基础模型相比,我们的方法始终改善了 BLEU 得分,尤其在推理效率方面提高了 14.8 倍。