基于两阶段分类和数据增强的设备鲁棒性声场分类

Jul, 2020

基于两阶段分类和数据增强的设备鲁棒性声场分类

Device-Robust Acoustic Scene Classification Based on Two-Stage Categorization and Data Augmentation

Hu Hu, Chao-Han Huck Yang, Xianjun Xia, Xue Bai, Xin Tang...

TL;DR实现了一个使用 CNN、数据增强、量化和模型融合的音频场景分类系统，可以将多个设备录制的音频信号精细分类为 10 个细粒度类别和 3 个高层级类别，并在不增加复杂度的情况下获得高准确率

Abstract

In this technical report, we present a joint effort of four groups, namely GT, USTC, Tencent, and UKE, to tackle Task 1 - acoustic scene classification (ASC) in the DCASE 2020 Challenge. Task 1 comprises two different sub-tasks: (i) Task 1a focuses on ASC of audio signals recorded with

acoustic scene classification cnns data augmentation quantization model fusion

发现论文，激发创造

设备鲁棒声场分类的两阶段方法

本文提出了一种基于卷积神经网络的双阶段系统来改善数据驱动声景分类的鲁棒性，通过探究不同的神经网络架构和数据扩充方案以及利用 class activation mapping 进行神经元显著性分析，该系统在 DCASE 2020 Task 1a 上达到了目前最高的准确率 81.9%。

Nov, 2020

韧性、通用且低复杂度声景分类系统和一个有效的声景上下文呈现可视化工具

本文提出了一种基于残差 - 插入结构网络的深度神经网络模型，实现了场景噪音的准确识别，并进行了模型细节及误差分析，提高了模型效果和性能，同时提出了一种可视化方法以全面展示场景上下文。

Oct, 2022

采用师生方案和多频谱图的音效场景分类低复杂度深度学习框架

本文提出了一种低复杂度深度学习系统，通过两个阶段的教师 - 学生网络训练，从而实现声场分类问题的高精度解决，精度达到了 57.4% 并且比常规的 DCASE 基线提升了 14.5%。

May, 2023

DCASE 2020 挑战中的声音场景分类：跨设备泛化和低复杂度解决方案

本文介绍了 DCASE 2020 挑战赛的任务 1：声学场景分类的详细信息，该任务包含两个子任务：使用多个设备的数据进行分类，需要良好的泛化性能，并且使用低复杂度解决方案进行分类。在这里，我们描述了数据集和基线系统。在挑战提交截止日期之后，将添加挑战结果和提交的分析。

May, 2020

低复杂度 CNN 音场分类

本文提出了一种低复杂度卷积神经网络框架及相应模型压缩技术和结合多低复杂度卷积神经网络的集成框架，实验表明该框架在声场分类任务上能够获得较好的性能提升。

Jul, 2022

一个用于城市声景分类的多设备数据集

本文介绍了 DCASE 2018 挑战赛的声景分类任务和提供给该任务的 TUT Urban Acoustic Scenes 2018 数据集，并评估了基线系统在该任务中的性能。同时，本文还提出了基线系统，该系统包括卷积神经网络，并介绍了其在子任务中的性能。

Jul, 2018

声学场景分类

介绍声音场景分类中的一些当前前沿、定义一个标准框架，并提供各种不同算法、提交给数据挑战以及评估人类分类准确性的表现，最终得出三种算法显著优于基准方法，但在某些场景下算法和人类都会出现误差。

Nov, 2014

DCASE 挑战赛 2016 上的实验：现实录音中的声音场景分类和声音事件检测

本文介绍了我们在实战录音的声音场景分类任务和声音事件检测任务中采用的低级和高级特征、分类器优化以及特定的其他方法，我们的表现优于 DCASE 的基线，对于任务 1，我们的总体准确性为 78.9％，超过基线 72.6％；对于任务 3，我们的基于段的错误率为 0.76，超过基线 0.91。

Jul, 2016

用卷积神经网络和 x-vector 嵌入进行 DCASE2018 声学场景分类挑战

本文描述了布尔诺科技大学参加 DCASE-2018 挑战的任务 1（声景分类，ASC）提交作品。采用了两种不同的卷积神经网络拓扑结构，结合了 log mel-spectrogram 和 CQT 特征提取声音，以及一维 CNN 提取固定长度的 x 向量。多种系统输出采用简单的输出平均法，最优表现中我们的提交获得了 ASC 子任务 A（task1a）24 个团队中的第三名。

Oct, 2018

IEEE ICME 2024 大挑战赛：领域偏移下的半监督声学场景分类

在 ICME 2024 大挑战中，我们引入了半监督领域迁移音景分类任务，鼓励参与者创新半监督学习技术，旨在开发更具鲁棒性的 ASC 模型。

Feb, 2024