ACLDec, 2021

DOCmT5: 多语言语言模型的文档级预训练

TL;DR本文介绍了一个多语言序列到序列的自然语言模型 DOCmT5,采用大规模平行文档进行预训练和一种名为 DrMT 的文档重排机器翻译方法,通过在各种文档级处理任务上进行,包括文档翻译、跨语言摘要等,达到了业内领先的结果。