Oct, 2016

原始波形的深度卷积神经网络

TL;DR本文提出了一种利用深度卷积神经网络从原始波形数据中直接学习音频模型的方法,通过批归一化、剩余学习和精心设计的下采样实现高效处理音频波形,并在环境声音识别任务中取得了 15% 的性能提升,达到了使用对数 - 梅尔特征的模型的性能。