Apr, 2019
统计参数语音合成的神经源 - 滤波波形模型
Neural source-filter waveform models for statistical parametric speech synthesis
Xin Wang, Shinji Takaki, Junichi Yamagishi
TL;DR提出了一种不需要自回归或逆自回归的神经源 - 滤波器 (NSF) 波形建模框架,该框架比 WaveNet 等传统自回归模型具有更快的波形生成速度,并且所生成的合成语音质量至少与 WaveNet 相当。