NIPSMay, 2017

Deep Voice 2: 多说话人神经文本转语音

TL;DR介绍了一种使用低维度可训练说话人嵌入的神经文本转语音技术,可以从单个模型生成不同的声音,并构建了具有高性能的构建组件:Deep Voice2 和后处理神经语音合成器的 Tacotron,通过两个多说话人 TTS 数据集演示了多说话人语音合成技术。