Jun, 2023

PolyVoice: 语言模型用于语音翻译

TL;DR我们提出了 PolyVoice,这是一个基于语言模型的语音 - 语音翻译(S2ST)系统,利用离散化语音单元实现对未书写语言的翻译。在语音合成方面,我们采用现有的 VALL-E X 方法构建基于单元的音频语言模型来保留原始语音的音色特征和语音风格。实验结果表明,我们的系统可以生成高质量翻译和音频质量的语音。