Sep, 2023

跨语句条件化变分自编码器的语音生成

TL;DR利用神经网络驱动的语音合成系统解决了表达性语音和无缝编辑的问题,通过 Cross-Utterance Conditioned Variational Autoencoder speech synthesis (CUC-VAE S2) 框架提供了上下文敏感的韵律特征生成和模拟人类语音韵律生成的实现方式,并在文本转语音和语音编辑两个方面提出了实用的算法,实验证明这些模型显著提升了语音合成和编辑的效果。