动物声音分类的高级框架与特征优化

Jul, 2024

动物声音分类的高级框架与特征优化

Advanced Framework for Animal Sound Classification With Features Optimization

Qiang Yang, Xiuying Chen, Changsheng Ma, Carlos M. Duarte, Xiangliang Zhang

TL;DR我们提出了一种自动化的动物声音分类框架，使用深度学习模型和优化的声音特征从 MFCC 中提取深度语义特征，相较基线方法，在精确度、召回率和准确度上性能提升超过25%，在动物声音分类中具有潜在的进展。

Abstract

The automatic classification of animal sounds presents an enduring challenge in bioacoustics, owing to the diverse statistical properties of sound signals, variations in recording equipment, and prevalent low Sig

发现论文，激发创造

使用卷积神经网络和新型声学表示法进行海洋哺乳动物物种分类

本文介绍了一个卷积神经网络，其能够对三种鲸鱼、非生物噪声和环境噪声进行分类，以便于检测出水声记录中的鲸鱼叫声。作者们还提出一种新的声学信号表示方法，该方法建立在常用的谱图表示的基础上，通过差值和堆叠使用不同的短时傅里叶变换参数生成的多个谱图。该方法特别适用于海洋哺乳动物物种分类的任务中。

Jul, 2019

评估小型脚印深度学习方法在新标注数据集上的西地中海湿地鸟类分类

本文提出了一种基于生态学价值自动化分析和检测鸟类物种的专家系统的部署，该系统通过无线声学传感器网络和具有深度学习技术的深度神经网络来实现鸟类的准确分类，并对 VGG16、ResNet50 和 MobileNetV2 这三种深度神经网络的效果进行比较分析，发现 MobileNetV2 的 F1 得分优于 VGG16 而略低于 ResNet50，且模型大小小得多。

Jul, 2022

使用二元预排序提高基于深度学习的灵长类动物声音分类

在野生动物观测和保护领域中，本研究介绍了一种基于机器学习的方法，利用声音记录和 MEL 频谱图的子区段进行二分类和多类别分类，在分类任务上表现显著优于之前的模型基线。

Jun, 2023

资源受限环境中的深度主动音频特征学习

讨论一种在生物声学应用中使用主动学习框架并结合特征提取的方法，能够有效减少数据标记的工作量，提高分类模型的效果。

Aug, 2023

生物声音的自动深度学习

该研究探讨了自动化深度学习在多类鸟类声音分类中提高准确性和效率的潜力，与传统手动设计的深度学习模型进行对比。采用西地中海湿地鸟类数据集，研究了使用AutoKeras（一种自动化机器学习框架）来自动化神经架构搜索和超参数调优。比较分析验证了我们的假设，即AutoKeras导出的模型在性能上一直优于传统模型（如MobileNet、ResNet50和VGG16）。该研究突显出自动化深度学习在推动生物声学研究和模型方面的变革潜力，事实上，自动化技术消除了对手动特征工程和模型设计的需求，同时提高了性能。该研究通过样本、评估和报告的最佳实践，提升了这一新兴领域的可复制性。所有使用的代码可在https://github.com/giuliotosato/AutoKeras-bioacustic获取。

Nov, 2023

面向声学生物多样性监测的小型精确卷积神经网络

通过使用时间索引标签及适当大小的 RF，我们设计出了适用于紧凑低成本设备的小型 CNN 模型，实现了较好的分类性能。

Dec, 2023

自主学习用于少样本鸟声分类

自监督学习在音频领域具有重要潜力，本研究证明自监督学习可以在无需注释的情况下从音频记录中获取有意义的鸟类声音表示，并展示了这些学习表示能够在少样本学习情景中泛化到新的鸟类物种。另外，使用预训练的音频神经网络，在自监督学习中选择高鸟类激活窗口显著提高了学习表示的质量。

Dec, 2023

animal2vec和MeerKAT：用于稀有事件原始音频输入的自监督变换器和用于生物声学的大规模参考数据集

通过深度学习方法，使用animal2vec框架并提供了MeerKAT数据集，可以对稀疏的生物声学数据进行分类和建模，从而为生物声学研究提供了新的参考和基准。

Jun, 2024

面向鸟类生物声学的深度主动学习

被动声学监测（PAM）在鸟类生物声学中能够以最小干扰自然栖息地的方式实现经济高效、广泛的数据收集。本文概述了一种深度主动学习方法，介绍了关键挑战，并进行了一个小规模的试点研究。

Jun, 2024

鸟鸣分类中的泛化：迁移学习方法与数据集特征的影响

本研究解决了生物声学物种分类器在不同物种和栖息地中的性能不均衡问题，采用了多种迁移学习方法和数据集特征进行大规模鸟音分类。研究发现，细调和知识蒸馏都能显著提高分类性能，而在复杂声景中，浅层细调表现更佳，凸显了其鲁棒性和局限性。建议动物声音领域采用更全面的标注实践，以增强鸟鸣分类器的训练效果。

Sep, 2024