BriefGPT.xyz
Ask
alpha
关键词
neural text-to-speech
搜索结果 - 23
利用量化的细粒度 VAE 和自回归韵律先验生成多样且自然的文本语音样本
本文提出了一种离散潜在空间的顺序先验方法,可以更自然地生成高度连续的语音,通过使用向量量化(VQ)对潜在特征进行离散化,并分别在结果上训练自回归(AR)先验模型,在听觉测试和自动语音识别(ASR)性能的客观指标方面,实验结果表明所提出的模型
→
PDF
4 years ago
半监督生成建模用于可控语音合成
本文提出一种新颖的生成模型,它将最先进的神经文本到语音技术和半监督概率潜变量模型相结合。通过对某些潜变量进行部分监督,我们能够强制它们具有一致和可解释的特征,这在纯无监督的文本到语音模型中过去是不可能的。我们证明了我们的模型能够可靠地发现和
→
PDF
5 years ago
使用 Transformer 神经网络进行语音合成
本文尝试使用 Transformer network 和 multi-head attention 机制来解决 neural text-to-speech 中的 training efficiency 和 long range depend
→
PDF
6 years ago
Prev
Next