Apr, 2020

ESResNet:基于视觉领域模型的环境声音分类

TL;DR本文提出了一种基于 STFT 频谱图与图像领域多个网络模型相结合的模型并针对标准数据集进行了评估,在 Environmental Sound Classification 领域中取得了目前最高的分类精度。同时对该领域已有的研究方法进行了全面梳理,为其他研究提供了实用的参考。