BriefGPT.xyz
大模型
Ask
alpha
关键词
speech attributes
搜索结果 - 2
Mega-TTS: 具有本征归纳偏置的大规模零样本文本转语音
该研究基于语音属性的分解和对应的感性偏见,提出了一种基于方谱的 TTS 系统 Mega-TTS,训练了 20k 小时的语音数据,实现了零样本文本到语音的高质量生成。
PDF
a year ago
半监督生成建模用于可控语音合成
本文提出一种新颖的生成模型,它将最先进的神经文本到语音技术和半监督概率潜变量模型相结合。通过对某些潜变量进行部分监督,我们能够强制它们具有一致和可解释的特征,这在纯无监督的文本到语音模型中过去是不可能的。我们证明了我们的模型能够可靠地发现和
→
PDF
5 years ago
Prev
Next