BriefGPT.xyz
大模型
Ask
alpha
关键词
zero-shot speech synthesis
搜索结果 - 3
元学习文本转语音在 7000 多种语言中的应用
通过大规模多语言预训练和元学习,我们构建了一个能够在超过 7000 种语言中生成语音的单一文本转语音合成系统,并通过客观评估和人工评价验证了该系统在多样化语言环境下的性能。通过公开发布我们的代码和模型,我们旨在为语言资源有限的社区提供支持,
→
PDF
24 days ago
FlashSpeech:高效零射击语音合成
闪电语音是一种大规模零样本语音合成系统,使用比之前的方法推理时间约占 5%,具有高音质和高相似性的性能,同时实现了语音处理的多样性。
PDF
2 months ago
HierSpeech++:通过分层变分推断在语音的语义和声学表示之间建立联系以进行零样本语音合成
HierSpeech++ 是一种快速而强大的零样本语音合成器,适用于文本转语音(TTS)和语音转换(VC),通过采用层次化语音合成框架,显著提高了合成语音的健壮性、表达力和自然度,在零样本语音合成场景中实现了人类级质量。
PDF
7 months ago
Prev
Next