Apr, 2019

使用一维卷积神经网络进行端到端环境声音分类

TL;DR本文介绍了一种基于一维卷积神经网络实现的环境声音分类方法,其可以对任意长度的音频信号进行处理,并采用 Gammaone 滤波器对其进行初始化,通过进行实验,结果表明该方法可以在 UrbanSound8k 数据集上取得 89% 的平均准确率,且性能比大多数现有手工提取特征或使用 2D 表示的方法都要优异。