Apr, 2021

ESResNe (X) t-fbsp:学习音频时间 - 频率鲁棒变换

TL;DR本文旨在提高环境声音分类的准确性,通过利用基于复频 B - 样条小波的时频转换层,加强模型的信号抗干扰能力并考察不同预训练策略的影响。使用 ImageNet 和 AudioSet 两个大规模数据集进行权重初始化和训练,本文提出的模型在 ESC-50 和 UrbanSound8K 数据集上取得了更高的准确率,达到了 95.20% 和 89.14%。