Jul, 2022

M 适配器:端到端语音到文本翻译的语言形式适应

TL;DR本研究提出一种新型基于 Transformer 的 M-Adapter 方法,通过建模语音序列的全局和局部依赖关系,将语音表示特征适应到文字输入上,以缩小语音输出和文字输入之间的模态差距,从而提高端到端语音到文本翻译的质量,并在 Must-C En→DE 数据集上获得比强基准模型高达 1 BLEU 得分的表现。