Jun, 2023
通过神经音频编解码器和潜在扩散模型实现高质量歌声合成
HiddenSinger: High-Quality Singing Voice Synthesis via Neural Audio Codec and Latent Diffusion Models
Ji-Sang Hwang, Sang-Hoon Lee, Seong-Whan Lee
TL;DRHiddenSinger 是一个高质量的歌唱声音合成系统,使用神经音频编解码器和潜在扩散模型,解决了模型复杂性和可控性的问题,并在无标签歌声数据集上训练,产生了高品质的歌声合成结果。