Jan, 2022

CVSS Corpus 和大规模多语言语音到语音翻译

TL;DR该论文介绍了一种名为 CVSS 的大规模多语言至英语语音翻译 (S2ST) 语料库,可以从 21 种语言中提取平行的语句级别的 S2ST 对,并用最先进的 TTS 系统将 CoVoST 2 的翻译文本合成语音。此外,研究构建了基线多语言直接 S2ST 模型和串联 S2ST 模型,并对该语料库的有效性进行了验证。