May, 2021

使用深度卷积神经网络进行音频分类和标记的接收域正则化技术

TL;DR本文研究了不同音频任务中已知卷积神经网络架构的变体性能。结果表明,调整卷积神经网络的感受野对其广义性至关重要。通过跨越多个音频分类和标记任务进行系统测试,我们提出了几种系统方法来控制 CNN 的 RF,并表明使用我们提出的方法对 CNN 的 RF 进行正则化可以显着提高模型的广义性,在多项任务中取得了最优结果。