EMNLPOct, 2020

多任务学习训练神经机器翻译的灵活深度模型

TL;DR本文提出一种基于多任务学习的神经机器翻译模型,可以在推断过程中自适应不同深度配置,支持 24 种深度配置的解码,相比于传统的模型训练方法以及其他灵活深度模型训练方法(LayerDrop),本方法具有更大的灵活性和更好的性能表现。