BriefGPT.xyz
大模型
Ask
alpha
关键词
global style tokens
搜索结果 - 2
从文本预测端到端语音合成中的表现性语音风格
本文介绍了一种名为 “Text-Predicted Global Style Token” 的结构,能够使用 GST 技术,仅通过文本预测生成带有语音样式的合成语音,无需显式标签或辅助输入,并证明其能生成比两种基线模型更多具有音高和能量变化
→
PDF
6 years ago
Style Tokens:端到端语音合成中的无监督风格建模、控制和转移
本文提出了 “全局风格标记”(GST),即在 Tacotron 中共同训练的嵌入库,用于无标签的声学建模,可用于控制合成音频的速度、讲话风格和样式转换,从而提高生成长篇文本的效率和鲁棒性。
PDF
6 years ago
Prev
Next