Nov, 2020

利用特定语言的编码器和解码器实现零 - shot 多语言口语翻译

TL;DR我们提出的多语言语音翻译方法可以不依赖 MultiSLT 数据集,仅基于 ASR 和 MultiNMT 数据进行训练,通过将语音编码器与 MultiNMT 架构耦合可以在零 - shot 场景下实现类似双语翻译的效果,在我们实验的四种不同语言中,通过使用适配器模块可以在提议的架构上实现 + 6 BLEU 点的一致改进和 + 1 BLEU 点的端到端基线改进。