EMNLPOct, 2020

多单元 Transformer 用于神经机器翻译

TL;DR本文提出了多单元 Transformer (MUTE) 方法,使用多个并行单元来提高 Transformer 的表现力和多样性,实验结果表明在三个机器翻译任务中,MUTE 显著超越了传统的 Transformer 方法,在参数使用和推理速度上具有高效性。