Oct, 2017

基于生成对抗网络的歌声分离技术 SVSGAN

TL;DR本文利用生成对抗网络(GAN)和时频掩模函数提出了一种新的人声分离框架,通过在对抗训练过程中进行混合谱分布和清洁谱分布之间的近似来进行分离,利用监督学习初始化参数并利用无监督学习进行优化,实验结果表明该框架可以提高音频分离效果。