基于熵的主动学习在具有渐进多样性约束的物体检测中的应用

CVPRApr, 2022

基于熵的主动学习在具有渐进多样性约束的物体检测中的应用

Entropy-based Active Learning for Object Detection with Progressive Diversity Constraint

Jiaxi Wu, Jiaxin Chen, Di Huang

TL;DR该研究提出了一种新颖的混合方法以解决目标检测领域中主动学习的难题，该方法通过两个阶段设计，在考虑实例级别的不确定性和多样性的基础上，运用熵值方法和各种策略有效提高了计算机视觉任务的性能表现。

Abstract

active learning is a promising alternative to alleviate the issue of high annotation cost in the computer vision tasks by consciously selecting more informative samples to label. →

active learning object detection entropy-based non-maximum suppression diverse prototype computer vision

发现论文，激发创造

基于概率建模的深度目标检测主动学习

本文提出了一种基于混合密度网络的深度主动学习方法，该方法通过对定位和分类器的输出估计概率分布并明确估计模型的不确定性，使用一种特殊得分函数将这两种不确定性聚合在一起以获取每个图像的信息量分数，通过 PASCAL VOC 和 MS-COCO 数据集的实验证明了该方法在物体检测方面的有效性，性能优于单模型和多模型方法，而计算成本仅为之前方法的一小部分。

Mar, 2021

极小 - 极大主动学习

该研究发展了一种基于半监督极小极大熵的主动学习算法，通过同时利用不确定性和多样性来选择最具代表性的样本，从而在图像分类和语义分割任务中表现优于现有的技术。

Dec, 2020

大数据驱动的安全自动驾驶中使用主动学习的原因、时间和方法：一项实证研究

在自动驾驶数据集中，采用主动学习策略可以解决数据不平衡、冗余和高维数据的挑战。我们展示了使用信息熵查询来选择信息丰富的样本，旨在降低注释成本和提高模型性能的有效性。我们在 nuScenes 数据集上使用 BEVFusion 模型进行了实验，将主动学习与随机抽样进行比较，并证明信息熵查询在大多数案例中表现优异。该方法在减少多数类和少数类之间的性能差距方面特别有效。类别特定的分析揭示了对有限数据预算进行注释资源的有效配置，强调选择多样性和信息丰富的数据用于模型训练的重要性。我们的发现表明，在资源受限的环境中，信息熵查询是选择增强模型学习的数据的一种有前途的策略。

Jan, 2024

深度目标检测主动学习

本研究结合活性学习和增量学习的方法，提出一种基于不确定度的适用于大多数对象检测器的主动学习度量标准，并探讨在样本选择过程中如何解决类别不平衡问题，通过系统评估在 PASCAL VOC 2012 数据集上，实现对新未标注数据集的持续探索。

Sep, 2018

利用不确定性和多样抽样的两步主动学习实例分割

我们提出了一种后期主动学习算法，该算法将基于不确定性的采样与基于多样性的采样相结合，不仅简单易实现，而且在各种数据集上都具有出色的表现，其实际应用在实际的高空图像数据集中增加了五倍的标注效率。

Sep, 2023

非冗余信息采样的目标检测主动学习

提出了一种新的主动学习采样策略，将不确定性和基于多样性的选择原则集成到一个联合选择目标中，通过测量所选样本的集体信息得分，有效地避免了冗余，并同时保持了高度的信息性，精选包含不同物体类型、形状和角度的数据集，在目标检测和图像分类任务中相比于随机选择降低了 20% 和 30% 的标注成本。

Jul, 2023

数据高效变化检测中遥感的深度主动学习

本论文研究了在深度神经网络模型中的主动学习，适用于诸如检测局部地表变化和地图更新等一些遥感任务，并使用各种机制捕捉和量化模型的不确定性，以选择有信息量的未标记样本进行注释，通过少量样本的标记就达到与大型训练集相同的性能的效果。

Aug, 2020

目标检测中嘈杂预测标注的深度主动学习

减少标注数量并保持算法性能，通过主动学习算法在活动数据集中进行标签审核，可以提高模型性能，尤其在与不确定性查询策略相结合时。

Sep, 2023

深度贝叶斯主动半监督学习

通过半监督深度学习与主动学习相结合的方法，使用尽可能少的标记样本，同时利用熵最小化对未标记样本进行训练，在 MNIST 数据集上仅使用 300 个标记样本实现 2.06% 的误差率和 1000 个标记样本实现 1.06% 的误差率。该方法可以获得高准确性的敏捷标注过程，同时节省标记成本。

Mar, 2018

面向物体检测的定位感知主动学习

本文介绍了两种度量目标假设信息量的度量方法：localization tightness 和 localization stability，这些方法可以使基于分类的主动学习算法更加有效地用于减少标注数据量以达到目标物体检测性能，实验结果表明，使用这些度量方法可以将所需标注数据量减少高达 25%。

Jan, 2018