Jul, 2018

深度编码器 - 解码器模型用于无监督学习可控语音合成

TL;DR本文针对非文字语音变化很少被注释的情况,研究了无监督学习控制统计语音合成的方法,包括将无监督训练试探法解释为某些自编码器模型中的变分推理等方式。研究发现,这些新的概率诠释具有重要含义,并将几种方法应用于情感语音合成的音频建模,发现无监督学习的表达控制方法(无需情感标签)在很多方面可以与之前的最佳监督方案匹配或超越之。