Jun, 2019

使用深度自回归神经网络进行歌声合成的声学建模

TL;DR本文提出了使用自回归神经网络对歌声合成进行声学建模的方法,以更好地描述连续帧音频特征之间的依赖关系。实验结果表明,使用自回归模型的方法可以更有效地产生包含颤音的 F0 轮廓,并且可以比使用递归神经网络的传统方法实现更好的客观和主观性能。