Mar, 2022

自我知识蒸馏中的前后向查看:双向解码器用于神经机器翻译

TL;DR介绍了一种使用自我知识蒸馏和双向解码的神经机器翻译模型,使用这种方法可以鼓励自回归 NMT 模型提前规划,实验表明该方法在多个机器翻译数据集上比强 Transformer 基线方法显著优秀。