May, 2024

深空可分离蒸馏用于轻量级声场分类

TL;DR为了解决当前深度学习方法在声场分类中计算复杂度高、性能不理想的问题,我们提出了一种深度可分离蒸馏网络。该网络在对 log-mel 频谱图进行高低频分解的同时显著降低了计算复杂度,并特别设计了三种轻量级算子,包括可分离卷积、正交可分离卷积和可分离部分卷积,这些算子在声场分类任务中具有高效的特征提取能力。实验结果表明,与当前流行的深度学习方法相比,该方法在性能上提高了 9.8%,同时参数数量和计算复杂度更小。