ACLMay, 2023

双工扩散模型改进语音对语音翻译

TL;DR本文提出了一种基于双向扩散模型的可逆性语音翻译方法,通过将扩散概率模型应用于可逆的 Conformer 的两侧,使两个方向都能同时输入和输出不同语言的语音。实验表明,该模型在 ASR-BLEU 得分方面取得了显著的改进,成为了可逆性语音翻译的第一项成功。