Nov, 2023

HierSpeech++:通过分层变分推断在语音的语义和声学表示之间建立联系以进行零样本语音合成

TL;DRHierSpeech++ 是一种快速而强大的零样本语音合成器,适用于文本转语音(TTS)和语音转换(VC),通过采用层次化语音合成框架,显著提高了合成语音的健壮性、表达力和自然度,在零样本语音合成场景中实现了人类级质量。