野外昆虫识别：AMI 数据集

Jun, 2024

Insect Identification in the Wild: The AMI Dataset

Aditya Jain, Fagner Cunha, Michael James Bunsen, Juan Sebastián Cañas, Léonard Pasi...

TL;DR昆虫多样性丧失影响生态系统和农业，对昆虫研究提出了大规模机器学习和数据增强等解决方案。

Abstract

insects represent half of all global biodiversity, yet many of the world's insects are disappearing, with severe implications for ecosyste

insects biodiversity camera traps machine learning data augmentation

发现论文，激发创造

面向生物多样性的机器学习方法：一种新颖的野生蜜蜂数据集和用于机器学习辅助稀有物种注释的可解释性人工智能方法评估

通过建立一份昆虫图像数据集，并训练一个能够对其进行分类的模型，并针对昆虫图像数据集的独特性，研究了可解释的人工智能（XAI）方法来协助昆虫学家进行数据注释，该方法在分类准确性和鲁棒性方面获得良好结果。

Jun, 2022

昆虫基础：用于视觉昆虫理解的基础模型和大规模百万级数据集

通过引入一种名为 “Insect-1M” 的新型数据集，本研究旨在为虫类相关的基础模型训练提供资源，并通过微特征自监督学习方法和相关注意机制来提高昆虫图像建模效果，通过介绍一种描述一致性损失来改善微特征建模，从而在昆虫相关任务的标准基准上实现了最先进的性能，为下一代虫类相关视觉模型赋能，将其功能更接近于精准农业的终极目标。

Nov, 2023

深度学习实时识别公民科学数据中的昆虫

提出一种深度学习模型 InsectNet，以应对昆虫识别在实际环境下的挑战，并能准确识别超过 2500 种节肢动物物种，包括有害害虫、寄生虫、食草动物和掠食动物，并可指导公民科学数据收集。

Jun, 2023

自动昆虫监测的机器学习流程

通过相机陷阱监测昆虫，包括目标检测、飞蛾和非飞蛾的分类、详细识别昆虫物种和个体跟踪，为昆虫学提供了可扩展的数据采集工具。

Jun, 2024

全球生物多样性评估的一步：BIOSCAN-1M 昆虫数据集

为了对昆虫生物多样性进行编目，我们提出了一个新的手动标注昆虫图像的大型数据集，BIOSCAN-Insect 数据集。该数据集由专家进行分类，同时还提供相关的遗传信息，包括原始核苷酸条形码序列和分配的条形码索引号，这些是基于基因的物种分类的代理。本文介绍了一个由百万图像组成的精选数据集，主要用于训练能够提供基于图像的分类评估的计算机视觉模型，然而，该数据集还具有引人注目的特征，研究这些特征对于更广泛的机器学习社区也是有兴趣的。受数据集固有的生物学特性驱动，显示出了具有长尾类别不平衡分布的特点。此外，分类标签是一个分层分类方案，对低层级的问题提出了非常细粒度的分类问题。通过在实施和分析基准分类器的过程中探索分类任务，本文将促进机器学习社区对生物多样性研究的兴趣，并推动创建基于图像的分类器的进展，这也将进一步实现 BIOSCAN 研究的终极目标：为全球生物多样性的综合调查奠定基础。

Jul, 2023

基于光电相机的夜间昆虫自动视觉监测

自动相机协助监测昆虫数量是理解和对抗昆虫减少的关键，本文介绍了两个在中欧拍摄的夜间昆虫数据集，强调了特别是鳞翅目的飞蛾。研究利用这些数据集开发和评估了一个昆虫检测和飞蛾种类分类的工具，并且提出了一个用于自动化视觉监测的原型系统。该论文同时为这些数据集提供了第一批检测和分类的基线，并鼓励其他科学家使用这些公开可用的数据。

Jul, 2023

多传感器数据融合用于自动化昆虫监测 (KInsecta)

通过多传感器、基于人工智能的数据融合方法，本文提出了一种低成本配置的昆虫分类系统，可用于系统性监测昆虫种群、支持生物多样性与农业研究。

Apr, 2024

iNaturalist 物种分类与检测数据集

本论文提出了 iNaturalist 物种分类和检测数据集，包括来自全球 5000 多种植物和动物的 859,000 张图片，其中包括视觉相似的物种以及具有各种图像质量和类不平衡性的图片。通过对数据集进行广泛的基准实验，本文的结果表明目前基于非集成方法的计算机视觉分类和检测模型只能达到 67% 的准确率，提出了面临的挑战和需要更多低阶学习关注的解决方案。

Jul, 2017

昆虫分类的低成本机器视觉

在环境可持续性领域，保护昆虫的数量和多样性是我们社会最重要的目标之一。本研究提出了一种图像方法作为多传感器系统的一部分，该系统是适应传统捕捉器类型的低成本、可扩展、开源系统。研究结果证明，重新训练后的标准 CNN 架构（如 ResNet50 和 MobileNet）在昆虫分类预测任务中表现非常出色，达到了超过 96％的分类准确率。此外，证明了昆虫图像裁剪对于具有高间类相似性的物种分类是必要的。

Apr, 2024

自动视觉蛾类监测的深度学习流水线：昆虫定位与物种分类

提供了一个深度学习方法的昆虫监测系统，通过定位和分类识别图像中的蛾子个体来改善物种识别准确率。

Jul, 2023