ACLMay, 2021

堆叠声学 - 文本编码:将预训练模型整合进语音翻译编码器

TL;DR本文提出了一种堆叠声音和文本编码方法(SATE),以改进现有的自动语音识别和机器翻译编码器不足,使其更适合于末端到末端的语音翻译任务。实验结果表明,我们的方法在 LibriSpeech En-Fr 和 MuST-C En-De ST 任务上,都获得了最新的 BLEU 分数。