ACLMay, 2021

语音到文本转换的共享语义空间学习

TL;DR该论文提出了一种名为 Chimera 的方法,该方法通过投影音频和文本特征到一个共同的语义表示来统一文本翻译和语音翻译任务,从而提高了 MuST-C 和 Augmented Librispeech 的 ST 基准性能至新的最先进水平。