NIPSNov, 2017

揭示表现力语音合成的潜在风格因素

TL;DR本研究通过引入风格编码器,提出了一种基于数据驱动学习的语音合成模型,无需额外标注即可单独学习语音中的韵律风格,能够在一定程度上预测并控制合成语音的韵律风格。