Jul, 2020

高效网络用于通用音频源分离

TL;DR本文提出了一种高效的神经网络用于端到端通用音频源分离,使用了连续下采样和多分辨率特征重取样(SuDoRMRF)的骨干结构,以及通过简单的一维卷积来执行特征聚合,从而实现了高质量的音频源分离,同时具有受限的浮点运算、内存需求、参数数量和延迟。我们在语音和环境声音分离数据集上的实验表明,SuDoRMRF 可与多种需要更高计算资源的最先进方法相媲美,甚至表现更优越。