Jul, 2020

基于两阶段分类和数据增强的设备鲁棒性声场分类

TL;DR实现了一个使用 CNN、数据增强、量化和模型融合的音频场景分类系统,可以将多个设备录制的音频信号精细分类为 10 个细粒度类别和 3 个高层级类别,并在不增加复杂度的情况下获得高准确率