少样本声音事件检测的多任务帧级学习

Mar, 2024

少样本声音事件检测的多任务帧级学习

Multitask frame-level learning for few-shot sound event detection

Liang Zou, Genwei Yan, Ruoyu Wang, Jun Du, Meng Lei...

TL;DR通过使用创新的多任务帧级音频事件检测框架和线性定时遮罩进行数据增强，提高模型对多样音频环境的适应性和鲁棒性，本研究在 2023 声音场景和事件检测与分类挑战赛的 few-shot 生物声学事件检测类别中实现了 63.8% 的 F 分数，获得第一名。

Abstract

This paper focuses on few-shot sound event detection (SED), which aims to automatically recognize and classify sound events with limited samples. However, prevailing methods methods in few-shot SED predominantly rely on

few-shot sound event detection segment-level predictions frame-level prediction strategies multitask frame-level sed framework timefilteraug

发现论文，激发创造

弱标注数据中的声音事件检测和时间频率分割

本文描述了如何使用弱标记的数据，提出了一种基于时频分割框架的声音事件检测和分离方法。文中提出的方法包括使用卷积神经网络处理分割映射和使用全局加权排名池化处理分类映射，从而可以在 F1 方面优于现有方法。

Apr, 2018

DiffSED：使用降噪扩散的声音事件检测

通过采用生成学习的角度来重新构建声音事件检测问题，我们的模型在训练中学习逆转噪声处理，从而能够从噪声查询中生成准确的事件边界，实验证明在 Urban-SED 和 EPIC-Sounds 数据集上，我们的模型在训练中具有 40% 以上的更快收敛速度并明显优于现有的替代方法。

Aug, 2023

使用 CNN-Transformer 和自动阈值优化进行弱标记数据的声音事件检测

本论文提出了一种使用卷积神经网络变换器的方法用于音频标记和音频事件检测中缺乏以前研究的以片段和全片为训练的声音事件检测（SED）的比较，并提出了一种自动阈值优化方法，其显着地提高了系统性能。

Dec, 2019

使用两阶段策略的多音色声音事件检测和定位

本文提出基于神经网络的声音事件检测和定位方法，该方法训练得到的声音事件检测模型可以帮助到方位角的估计，同时也能够显著提高声音事件检测和方位角估计的性能。

May, 2019

装备声音事件检测与语言模型能力

通过语言模型结合音频特征和文本特征，本研究提出了一种高效的声音事件检测方法，实现了精准的声音事件分类和时序定位。与传统方法相比，该模型更简洁全面，直接利用语言模型的语义能力生成时序和事件序列，获得了准确的声音事件检测结果。

Aug, 2023

基于分段的度量学习用于少样本生物声音事件检测

本文提出了一种利用 segment-level few-shot learning 框架来在少量正负例的情况下检测生物声音事件。实验结果表明，使用负样本有利于提高模型的泛化能力，采用在验证集上的推导式推理可以更好地适应新颖的类别。该方法在 DCASE2022 挑战任务 5 中超越了基线，排名第 2，并已在 https URL 上开源。

Jul, 2022

适应性少样本学习算法在稀有声音事件检测中的应用

本研究提出了一种新颖的任务自适应模块，用于度量学习框架的少样本学习中，并在两个数据集上实现了比基线方法取得了更好的性能，特别是在转导传播网络上，例如在 ESC-50 的 5 路 1-shot 准确性上提高了 6.8％，在 noiseESC-50 上提高了 5.9％。

May, 2022

使用软场景标签进行声音事件和场景的多任务学习声音事件检测

本文提出了一种新的使用环境声音软标签来基于多任务学习（MTL）的声音事件检测（SED）方法用于与声学场景分类（ASC）同时进行分析的方法，该方法相比传统的基于 MTL 的 SED 方法在 F 分数上提高了 3.80％。

Feb, 2020

利用空间和谐特征在多通道音频中进行声音事件检测

本文提出使用空间和谐特征结合 LSTM 循环神经网络进行自动声音事件检测任务，并将其与现有的单声道方法进行比较，结果表明使用多声道音频、空间和谐特征的自动声音事件检测方法能够提高检测性能。

Jun, 2017

DCASE 2023 挑战中的少样本生物声事件检测

DCASE 挑战赛的 Few-shot 生物声学事件检测任务中，限制训练数据集，于 2023 年共有 6 个团队参加，最高 F-score 达到 63％，方法多样。

Jun, 2023