BriefGPT.xyz
Ask
alpha
关键词
acoustic feature
搜索结果 - 2
M2-CTTS: 端到端的多尺度、多模态会话文本到语音合成
提出了一种多尺度,多模态会话文本到语音系统(M2-CTTS),用于综合利用历史会话并增强韵律表达,通过考虑文本和声学因素的粗粒度和细粒度建模,并混合细粒度上下文信息及声学特征,实现了更好的韵律表现和自然度。
PDF
a year ago
StarGAN-VC2: 基于 StarGAN 的语音转换中重新思考条件方法
本研究提出了一种改进的条件方法 StarGAN-VC2,包含源域和目标域的条件对抗损失和基于调制的条件方法,来使多域语音转换更加准确和自然。实验结果显示,该方法在语音质量和说话人相似度方面优于之前的 StarGAN-VC 模型。
PDF
5 years ago
Prev
Next