Aug, 2020

基于说话人条件的 WaveRNN: 通向未知说话人和录音条件的通用神经编码器

TL;DR本研究提出了一种基于演讲者条件 WaveRNN(SC-WaveRNN)的语音合成方法,通过使用说话人嵌入信息,能够实现更好的泛化和更高的合成质量,并在多说话人 TTS 合成中实现了类似于零样本适应的性能提升。