EMNLPSep, 2021

BERT、mBERT 还是 BiBERT?关于上下文化嵌入用于神经机器翻译的研究

TL;DR本研究通过将定制和合适的双语预训练语言模型(称为 BiBERT)的输出(上下文嵌入)作为神经机器翻译编码器的输入,展示了实现最先进的翻译性能的方法,并提出了一种随机层选择方法和双向翻译模型的概念,以确保充分利用上下文嵌入。