Jun, 2023

StyleTTS 2:通过样式扩散和大型语音语言模型的对抗训练实现人类水平的文本朗读

TL;DR本文提出了 StyleTTS2,它是一个使用了样式扩散和对抗训练技术以及大型语音语言模型的文本转语音模型,它能够有效地进行潜在扩散,实现单个和多个说话人的人类级 TTS 合成。