Mar, 2019
通过音频分析控制表现性语音合成的潜空间可视化和解释
Visualization and Interpretation of Latent Spaces for Controlling Expressive Speech Synthesis through Audio Analysis
Noé Tits, Fengna Wang, Kevin El Haddad, Vincent Pagel, Thierry Dutoit
TL;DR该论文研究基于深度学习的文字转语音技术,着重关注控制表现力的研究,探讨不同潜在变量对语音表现力的影响,以期构建可控的语音合成系统。