Oct, 2021

多语言领域自适应翻译:通过适配器解耦语言和领域信息

TL;DR本文研究了在机器翻译领域中适配器的组成方法,旨在实现多领域和多语言(全资源场景)的参数效率适配,或在无法提供特定语言对的平行数据(部分资源场景)中的跨语言转移。适配器通常由语言特定的适配器和领域特定的适配器组成,但这篇论文发现了将两种适配器简单组合的方法往往会造成缺失语言的灾难性遗忘,因此提出了新的适配器组合方式以减轻这一问题,并最大程度地实现跨语言转移。通过此种最佳适配器组合方式,我们实现了在没有场内数据的源语言上平均提高 3-4BLEU,而在没有场内数据的目标语言上与反向翻译相结合也达到了类似的改进。