BriefGPT.xyz
Ask
alpha
关键词
expressive tts
搜索结果 - 3
NoreSpeech: 基于知识蒸馏的条件扩散模型,用于噪声鲁棒性表达 TTS
本论文提出了一种噪声鲁棒的表现性文本转语音模型(NoreSpeech),它能够从嘈杂的语音参考中有效地转移说话风格到合成语音中,这是通过一个新颖的 DiffStyle 模块,一个 VQ-VAE 块和一个可控的文本对齐模块实现的。实验表明,N
→
PDF
2 years ago
神经语音合成调查
本文全面调研了神经网络 TTS 在包括文本分析、声学模型、声码器等方面的研究进展,进一步总结了相关资源(数据集、开源实现),并提出了未来的研究方向。
PDF
3 years ago
使用 Style 标签的生动文本转语音技术
本文提出了一种使用自然语言编写的样式标记的新型情感语音合成模型 StyleTagging-TTS,并使用预训练的语言模型对语言嵌入和说话风格域之间的关系进行建模,实现了对未见过的样式标记的控制。相比目前的表情 TTS 模型,该模型表现出更好
→
PDF
3 years ago
Prev
Next