Apr, 2016

适用于真实录音的多声音事件检测的循环神经网络

TL;DR本文提出了一种基于 BLSTM 循环神经网络的多音事件检测方法,该方法通过训练一个多标签 BLSTM RNN,将包括音乐、车辆、讲话等 61 类在内的多种声音的声学特征映射到每个事件类别的二进制活动指示符上,并且通过使用数据增强技术进一步提高了识别结果的准确性,系统在实测中平均 F1 分数分别为 65.5%和 64.7%。