May, 2022

TranSpeech: 双向干扰下的语音翻译

TL;DR本文提出了使用双向扰动的语音到语音翻译模型TranSpeech,该模型通过样本的风格归一化和信息提升改善了离散单元之间的声学多模性,并且使用了非自回归技术来提高翻译速度和准确性。实验结果表明,与基准S2ST模型相比,BiP平均提高了2.9 BLEU分数,并且我们的并行解码技术使推理延迟大幅降低。