深度音频嵌入解析鸟鸣
使用现代机器学习技术进行鸟类检测,无需人工重新校准,也不需要针对目标物种或目标环境中的声学条件进行预训练,可在远程监测数据中实现非常高的检索率,达到约 88%的 AUC 性能,并讨论了将这种检测方法整合到远程监测项目中的方法。新的声学监测数据集被提出并进行了详细的性能评估。
Jul, 2018
该研究探讨了自动化深度学习在多类鸟类声音分类中提高准确性和效率的潜力,与传统手动设计的深度学习模型进行对比。采用西地中海湿地鸟类数据集,研究了使用 AutoKeras(一种自动化机器学习框架)来自动化神经架构搜索和超参数调优。比较分析验证了我们的假设,即 AutoKeras 导出的模型在性能上一直优于传统模型(如 MobileNet、ResNet50 和 VGG16)。该研究突显出自动化深度学习在推动生物声学研究和模型方面的变革潜力,事实上,自动化技术消除了对手动特征工程和模型设计的需求,同时提高了性能。该研究通过样本、评估和报告的最佳实践,提升了这一新兴领域的可复制性。所有使用的代码可在 https://github.com/giuliotosato/AutoKeras-bioacustic 获取。
Nov, 2023
通过建立鸟鸣音的生成模型和采用新颖性检测技术,可以在全球范围内使用廉价的无人值守记录站或使用移动设备上的录音和物种识别进行大规模众包,可靠地识别动物物种的能力受到限制。
May, 2015
我们提出将自我监督(SSL)和深度主动学习(DAL)结合起来,转向端到端学习进行鸟类声音监测。利用 Transformer 模型,我们旨在绕过传统的频谱图转换,实现直接的原始音频处理。通过 SSL,ActiveBird2Vec 将生成高质量的鸟类声音表示,可能加快对风电场环境变化和决策过程的评估。此外,我们还计划通过 DAL 利用多种鸟类鸣叫声,减少对人工专家 extensively labeled 数据集的依赖。我们计划通过 Huggingface Datasets 整理一套全面的任务,增强生物声学研究的未来可比性和可重复性。将进行各种 Transformer 模型之间的比较分析,评估它们在鸟声识别任务上的熟练程度。我们旨在加速鸟类声学研究的进展并为更有效的保护策略作出贡献。
Aug, 2023
这项研究利用元信息来改善零样本音频分类,以鸟类物种作为例子进行了研究,并通过文本描述、功能特征和鸟类生活历史三种元信息的来源,提取了音频特征并采用零样本学习算法得出了最佳结果。
Sep, 2023
利用无损声学监测方法追踪全球生物多样性和人类活动对物种的影响,在此工作中,我们提出了一种基于对比语音 - 音频预训练的生物声学模型 BioLingual,该模型能够跨类别识别超过一千种动物的叫声并通过自然语言查询检索动物语音记录。
Aug, 2023
本研究着眼于设计一种无线传感器网络来支持对濒危鸟类族群的观测。在对样本的声学数据进行知识发现的初步阶段,我们使用从鸟歌中提取的 MFCC 特征和两种知识发现技术(基于聚类的方法和基于预测建模的方法)来分析数据。研究结果表明,机器学习技术在鸟类种类识别过程中具有良好的表现,并为基于声学传感器的自动数据收集方法的设计提供了有希望的结果和指导建议。
Jun, 2013
本文提出了一种基于生态学价值自动化分析和检测鸟类物种的专家系统的部署,该系统通过无线声学传感器网络和具有深度学习技术的深度神经网络来实现鸟类的准确分类,并对 VGG16、ResNet50 和 MobileNetV2 这三种深度神经网络的效果进行比较分析,发现 MobileNetV2 的 F1 得分优于 VGG16 而略低于 ResNet50,且模型大小小得多。
Jul, 2022
自监督学习在音频领域具有重要潜力,本研究证明自监督学习可以在无需注释的情况下从音频记录中获取有意义的鸟类声音表示,并展示了这些学习表示能够在少样本学习情景中泛化到新的鸟类物种。另外,使用预训练的音频神经网络,在自监督学习中选择高鸟类激活窗口显著提高了学习表示的质量。
Dec, 2023
這篇研究論文提出了一種基於 ConvNeXt 骨幹架構和 Prototypical Part Network(ProtoPNet)的音頻分類方法,通過原型模式學習每種鳥類的特徵模式,利用譜圖進行新數據的分類,從而同時提供可解釋性的模型決策解釋。
Apr, 2024