Feb, 2022

探讨语言模型架构的扩展与迁移在机器翻译中的应用

TL;DR该研究论文探讨了语言模型和编码器-解码器模型在机器翻译中的性能影响,结果表明:语言模型在小规模下的表现差,但随着参数数量的增加,其性能逐渐接近于编码器-解码器模型,语言建模和原因屏蔽会对翻译质量产生不利影响,而当与全局可视屏蔽相配合时,语言模型在受监督的双语和多语言翻译任务中能够与编码器-解码器模型持平,并且在零翻译方向上表现得更好。