BriefGPT.xyz
大模型
Ask
alpha
关键词
expressive speech
搜索结果 - 4
EmoSphere-TTS: 通过球形情感向量实现情感风格与强度建模的可控情感文本到语音技术
通过使用球形情感向量来控制合成语音的情感风格和强度,提出了 EmoSphere-TTS,该系统实现了表达性的情感语音。通过使用唤起度、愉悦度和支配性伪标签来模拟情感的复杂特性,进而提出了双条件对抗网络来提高生成语音质量,实验结果表明该模型能
→
PDF
22 days ago
面向对话文本到语音合成的半监督预训练用于自发风格建模
我们提出了一种半监督预训练方法,通过考虑文本和语音信息来检测语音中的自发行为标签,并使用语言感知编码器建模对话中每个句子之间的关系。实验结果表明,我们的方法能够实现更好的表达式语音合成性能,具备对自发式语音的自发行为建模以及从文本中预测合理
→
PDF
10 months ago
ProsoSpeech: 用量化向量预训练增强语音合成的韵律
介绍 ProsoSpeech 模型,通过量化预训练的潜在语调向量来增强 Prosody,该模型可生成具有比基线模型更丰富 Prosody 的表达性音频。
PDF
2 years ago
FastPitch:具有音高预测的并行语音合成
FastPitch 是一种基于基频轮廓的全并行文本到语音模型,可以预测音高轮廓并生成更具表现力的语音,同时保留着便利的 Transformer 架构,具备很高的速度和语音合成质量。
PDF
4 years ago
Prev
Next