Jun, 2021

通过自标注的词对齐改进预训练的跨语言语言模型

TL;DR该研究探讨了使用去噪词对齐作为新的跨语言预训练任务的方法,通过在双语对中进行自我标注的单词对齐,结合指针网络来预测清理片段中被屏蔽的单词及其在另一种语言中的对应单词,并在期望值最大化的方式下交替进行两个步骤,实验结果表明该方法在各种数据集上提高了跨语言可传递性。