MMMar, 2022

基于 1-D CNN 的声景分类通过逐层降低维度

TL;DR本文提出了一种基于卷积神经网络的替代时间 - 频率表示的声场分类框架,使用自动字典学习框架从中提取了低维嵌入,并通过 late-fusion 的方式聚合不同中间层的分层信息,取得了优于传统时间 - 频率表示方法的实验效果。