Mar, 2017

深度循环神经网络进行音频场景分类

TL;DR本文使用深度循环神经网络,将音频场景转换为一系列高级标签树嵌入特征向量序列,将其分割为多个子序列,并对序列进行标签分类,最终获得全局预测标签。在 LITIS Rouen 数据集上,实现了 97.7% 的 F1 分数,与该数据集上最佳结果相比,相对分类错误率减少 35.3%。