关键词environmental sound classification
搜索结果 - 6
- 强化解释性声音分类的焦点调制网络
通过使用最近提出的无注意力聚焦调制网络(FocalNets),这篇论文在音频领域首次将 FocalNets 应用于环境声音分类任务,评估了其可解释性在流行的 ESC-50 数据集上的性能。与类似规模的视觉变换器相比,我们的方法在准确性和可解 - 面向设备的环境声音持续学习
本文提出一个简单而有效的连续学习方法,通过测量每个样本的分类不确定性来选择历史数据进行训练,避免在设备上环境音分类时出现的计算资源限制问题,实验结果表明,该方法在分类准确性和计算效率方面优于基线模型,能有效并不断学习新类别。
- ESResNe (X) t-fbsp:学习音频时间 - 频率鲁棒变换
本文旨在提高环境声音分类的准确性,通过利用基于复频 B - 样条小波的时频转换层,加强模型的信号抗干扰能力并考察不同预训练策略的影响。使用 ImageNet 和 AudioSet 两个大规模数据集进行权重初始化和训练,本文提出的模型在 ES - ESResNet:基于视觉领域模型的环境声音分类
本文提出了一种基于 STFT 频谱图与图像领域多个网络模型相结合的模型并针对标准数据集进行了评估,在 Environmental Sound Classification 领域中取得了目前最高的分类精度。同时对该领域已有的研究方法进行了全面 - KDDAI for Earth: 通过声学监测进行雨林保护
利用声学监控和机器学习技术,提出一种创新方法来帮助保护雨林。通过引入新的卷积神经网络模型来进行环境声音分类,该模型在两个数据集上取得了良好的初步结果,这些模型可在自动化机器学习范式下轻松扩展,并集成到基于云的服务中进行实际部署。
- 深度卷积神经网络与数据增强在环境音分类中的应用
本文提出了一种使用深度卷积神经网络和音频数据增强相结合的方法来进行环境声音分类,通过对增强技术的探索发现在不同类别下所使用的增强技术会对分类准确率产生影响。实验结果表明,该方法在环境声音分类上表现出了最先进的效果。