Jun, 2022
基于言语风格潜在表示的端到端文本转语音技术:基于自然对话的研究
End-to-End Text-to-Speech Based on Latent Representation of Speaking Styles Using Spontaneous Dialogue
Kentaro Mitsui, Tianyu Zhao, Kei Sawada, Yukiya Hono, Yoshihiko Nankaku...
TL;DR本研究旨在实现一种接近于人类对话的 TTS,通过基于 VAE/GMVAE-VITS 的训练,利用上下文信息来综合预测所需样式的语音合成, 实验结果表明,该方法在对话级别的自然度方面优于原本的 VITS。