Nov, 2020

双解码器变压器模型实现联合自动语音识别与多语言语音翻译

TL;DR本文介绍了双解码器Transformer的新模型架构,该模型同时执行自动语音识别和多语言语音翻译。我们的模型基于原始Transformer体系结构,但由两个解码器组成,每个解码器负责一个任务(ASR或ST),并通过双关注机制相互交互。我们提出了两种不同的体系结构变体,分别对应于解码器之间的两个不同层次的依赖关系,称为并行双解码器Transformer和交叉双解码器Transformer。我们在MuST-C数据集上进行了大量实验,结果显示我们的模型在多语言设置中优于以前报道的最高翻译性能,并且也优于双语一对一结果。此外,我们的并行模型相对于香草多任务体系结构在ASR和ST之间没有权衡。