Aug, 2020
基于说话人条件的 WaveRNN: 通向未知说话人和录音条件的通用神经编码器
Speaker Conditional WaveRNN: Towards Universal Neural Vocoder for Unseen Speaker and Recording Conditions
Dipjyoti Paul, Yannis Pantazis, Yannis Stylianou
TL;DR本研究提出了一种基于演讲者条件 WaveRNN(SC-WaveRNN)的语音合成方法,通过使用说话人嵌入信息,能够实现更好的泛化和更高的合成质量,并在多说话人 TTS 合成中实现了类似于零样本适应的性能提升。