Apr, 2019

统计参数语音合成的神经源 - 滤波波形模型

TL;DR提出了一种不需要自回归或逆自回归的神经源 - 滤波器 (NSF) 波形建模框架,该框架比 WaveNet 等传统自回归模型具有更快的波形生成速度,并且所生成的合成语音质量至少与 WaveNet 相当。