少样本声音事件检测的多任务帧级学习
本文描述了如何使用弱标记的数据,提出了一种基于时频分割框架的声音事件检测和分离方法。文中提出的方法包括使用卷积神经网络处理分割映射和使用全局加权排名池化处理分类映射,从而可以在 F1 方面优于现有方法。
Apr, 2018
通过采用生成学习的角度来重新构建声音事件检测问题,我们的模型在训练中学习逆转噪声处理,从而能够从噪声查询中生成准确的事件边界,实验证明在 Urban-SED 和 EPIC-Sounds 数据集上,我们的模型在训练中具有 40% 以上的更快收敛速度并明显优于现有的替代方法。
Aug, 2023
本论文提出了一种使用卷积神经网络变换器的方法用于音频标记和音频事件检测中缺乏以前研究的以片段和全片为训练的声音事件检测(SED)的比较,并提出了一种自动阈值优化方法,其显着地提高了系统性能。
Dec, 2019
本文提出基于神经网络的声音事件检测和定位方法,该方法训练得到的声音事件检测模型可以帮助到方位角的估计,同时也能够显著提高声音事件检测和方位角估计的性能。
May, 2019
通过语言模型结合音频特征和文本特征,本研究提出了一种高效的声音事件检测方法,实现了精准的声音事件分类和时序定位。与传统方法相比,该模型更简洁全面,直接利用语言模型的语义能力生成时序和事件序列,获得了准确的声音事件检测结果。
Aug, 2023
本文提出了一种利用 segment-level few-shot learning 框架来在少量正负例的情况下检测生物声音事件。实验结果表明,使用负样本有利于提高模型的泛化能力,采用在验证集上的推导式推理可以更好地适应新颖的类别。该方法在 DCASE2022 挑战任务 5 中超越了基线,排名第 2,并已在 https URL 上开源。
Jul, 2022
本研究提出了一种新颖的任务自适应模块,用于度量学习框架的少样本学习中,并在两个数据集上实现了比基线方法取得了更好的性能,特别是在转导传播网络上,例如在 ESC-50 的 5 路 1-shot 准确性上提高了 6.8%,在 noiseESC-50 上提高了 5.9%。
May, 2022
本文提出了一种新的使用环境声音软标签来基于多任务学习(MTL)的声音事件检测(SED)方法用于与声学场景分类(ASC)同时进行分析的方法, 该方法相比传统的基于 MTL 的 SED 方法在 F 分数上提高了 3.80%。
Feb, 2020
本文提出使用空间和谐特征结合 LSTM 循环神经网络进行自动声音事件检测任务,并将其与现有的单声道方法进行比较,结果表明使用多声道音频、空间和谐特征的自动声音事件检测方法能够提高检测性能。
Jun, 2017
DCASE 挑战赛的 Few-shot 生物声学事件检测任务中,限制训练数据集,于 2023 年共有 6 个团队参加,最高 F-score 达到 63%,方法多样。
Jun, 2023