Mar, 2019
WGANSing:基于 Wasserstein-GAN 的多声部唱歌合成器
WGANSing: A Multi-Voice Singing Voice Synthesizer Based on the Wasserstein-GAN
Pritish Chandna, Merlijn Blaauw, Jordi Bonada, Emilia Gomez
TL;DR本研究提出了一种基于深度神经网络的歌声合成器,使用 Wasserstein-GAN 算法进行优化,通过声学建模的声码器参数,实现对歌唱声音中音高和音色的分离,采用分块方法建模输入块内的时间依赖关系,并使用重叠添加程序将连续块拼接在一起,该模型的绩效达到了与最先进技术相竞争的水平。