Jun, 2023

DSE-TTS:用于跨语言文本转语音的双说话人嵌入

TL;DR提出了一种新的双说话人嵌入式 TTS 框架,结合了一种嵌入式用于学习语言发音风格,另一个用于模拟目标说话人的音色,以解决跨语言 TTS 中的噪音干扰和说话人相似度问题。实验证明,这种框架在跨语言合成方面表现优异,尤其在语音自然度方面比最先进的方法要好。