May, 2020

使用生成先验进行无监督音频源分离

TL;DR通过将生成先验训练于各个单独的源上,利用梯度下降优化方法同时在这些源特定的潜在空间中搜索,以有效地恢复各个成分来源,并且通过在飞行中优化使用频谱失真函数而非直接定义波形 GAN 生成先验可以获得良好质量的源估计,我们针对语音数字和乐器数据集的实证研究表明,与传统的与最先进的无监督基线相比,我们的方法的有效性。