Jun, 2017

基于多通道 I-Vectors 和卷积神经网络的混合方法用于声学场景分类

TL;DR本文提出了一种改进基于 i-vectors 的音场识别方法和 CNN 模型,通过多通道 i-vector 提取和 CNN 模型结合的得分融合技术,取得了 DCASE-2016 挑战中音场识别任务的第一名,并展示了 i-vectors 和 CNN 模型各自在捕捉感知场景信息方面的优势以及它们所抓取的信息相互补充。