Feb, 2020

基于Transformer的机器翻译中固定编码器自注意力模式

TL;DR使用简单固定的关注模式替换Transformer中编码器层的大多数注意力头对神经机器翻译的质量没有影响,并且在资源匮乏的情况下,甚至可以将BLEU评分提高3个点。