Jun, 2017

利用空间特征和卷积循环神经网络进行声音事件检测

TL;DR本文提出使用从多通道音频中提取的低级空间特征进行声音事件检测,通过初始阶段从每个通道中单独学习这些多通道特征,扩展了卷积递归神经网络以处理更多类型的这些特征,并表明将特征呈现为体积的单独层,而不是将每个通道的特征串联成单个特征向量,可以更好地学习多通道音频中的声音事件。与单声道特征相比,在相同网络上使用所提出的空间特征,在公开可用的 TUT-SED 2016 数据集上的 F-score 提高了 6.1%,在 TUT-SED 2009 数据集上的 F-score 提高了 2.7%,该数据集是其 15 倍大。