Feb, 2022

ProsoSpeech: 用量化向量预训练增强语音合成的韵律

TL;DR介绍 ProsoSpeech 模型,通过量化预训练的潜在语调向量来增强 Prosody,该模型可生成具有比基线模型更丰富 Prosody 的表达性音频。