Apr, 2022

使用 CNN 的声景分类方法比较研究

TL;DR本文研究了使用神经网络进行环境声音分类的三种不同类型的表示:谱图、MFCC 和嵌入式表示,并使用不同的 CNN 网络和自编码器来评估它们在分类准确度上的效果。我们发现使用谱图的分类准确度最高,而使用 MFCC 的准确度最低,同时提出了一些指导性的结论和方法来提高声音环境分类的准确度。