ACLSep, 2021

多语言文档级翻译实现从句子到文档的零 - shot 转移

TL;DR本文研究了使用多语言模型从有文档的教师语言到只有句子级数据的学生语言的零 - shot 情况下如何将 DocNMT 中的上下文建模转移的问题,首次将文档级翻译视为一种迁移学习问题,并使用基于简单连接的 DocNMT,探索了 3 个因素对转移的影响。实验表明,使用更多的教师语言和适当的数据平衡都有助于提高转移质量。同时多语言 DocNMT 在真实文档对或者反向翻译对数据条件下均可实现较好的性能表现。