Jun, 2022

基于言语风格潜在表示的端到端文本转语音技术:基于自然对话的研究

TL;DR本研究旨在实现一种接近于人类对话的 TTS,通过基于 VAE/GMVAE-VITS 的训练,利用上下文信息来综合预测所需样式的语音合成, 实验结果表明,该方法在对话级别的自然度方面优于原本的 VITS。