动物声音分类的高级框架与特征优化
本文介绍了一个卷积神经网络,其能够对三种鲸鱼、非生物噪声和环境噪声进行分类,以便于检测出水声记录中的鲸鱼叫声。作者们还提出一种新的声学信号表示方法,该方法建立在常用的谱图表示的基础上,通过差值和堆叠使用不同的短时傅里叶变换参数生成的多个谱图。该方法特别适用于海洋哺乳动物物种分类的任务中。
Jul, 2019
本文提出了一种基于生态学价值自动化分析和检测鸟类物种的专家系统的部署,该系统通过无线声学传感器网络和具有深度学习技术的深度神经网络来实现鸟类的准确分类,并对 VGG16、ResNet50 和 MobileNetV2 这三种深度神经网络的效果进行比较分析,发现 MobileNetV2 的 F1 得分优于 VGG16 而略低于 ResNet50,且模型大小小得多。
Jul, 2022
在野生动物观测和保护领域中,本研究介绍了一种基于机器学习的方法,利用声音记录和 MEL 频谱图的子区段进行二分类和多类别分类,在分类任务上表现显著优于之前的模型基线。
Jun, 2023
该研究探讨了自动化深度学习在多类鸟类声音分类中提高准确性和效率的潜力,与传统手动设计的深度学习模型进行对比。采用西地中海湿地鸟类数据集,研究了使用AutoKeras(一种自动化机器学习框架)来自动化神经架构搜索和超参数调优。比较分析验证了我们的假设,即AutoKeras导出的模型在性能上一直优于传统模型(如MobileNet、ResNet50和VGG16)。该研究突显出自动化深度学习在推动生物声学研究和模型方面的变革潜力,事实上,自动化技术消除了对手动特征工程和模型设计的需求,同时提高了性能。该研究通过样本、评估和报告的最佳实践,提升了这一新兴领域的可复制性。所有使用的代码可在https://github.com/giuliotosato/AutoKeras-bioacustic获取。
Nov, 2023
自监督学习在音频领域具有重要潜力,本研究证明自监督学习可以在无需注释的情况下从音频记录中获取有意义的鸟类声音表示,并展示了这些学习表示能够在少样本学习情景中泛化到新的鸟类物种。另外,使用预训练的音频神经网络,在自监督学习中选择高鸟类激活窗口显著提高了学习表示的质量。
Dec, 2023
通过深度学习方法,使用animal2vec框架并提供了MeerKAT数据集,可以对稀疏的生物声学数据进行分类和建模,从而为生物声学研究提供了新的参考和基准。
Jun, 2024
被动声学监测(PAM)在鸟类生物声学中能够以最小干扰自然栖息地的方式实现经济高效、广泛的数据收集。本文概述了一种深度主动学习方法,介绍了关键挑战,并进行了一个小规模的试点研究。
Jun, 2024
本研究解决了生物声学物种分类器在不同物种和栖息地中的性能不均衡问题,采用了多种迁移学习方法和数据集特征进行大规模鸟音分类。研究发现,细调和知识蒸馏都能显著提高分类性能,而在复杂声景中,浅层细调表现更佳,凸显了其鲁棒性和局限性。建议动物声音领域采用更全面的标注实践,以增强鸟鸣分类器的训练效果。
Sep, 2024