Dec, 2019

将序列级知识蒸馏解释为神经机器翻译中的数据增强

TL;DR使用序列级知识蒸馏技术在数据增强和正则化的前提下训练较小的机器翻译模型,可实现类似于基准 SLKD 的结果,并显著提高 BLEU 分数。