基于熵的主动学习在具有渐进多样性约束的物体检测中的应用
本文提出了一种基于混合密度网络的深度主动学习方法,该方法通过对定位和分类器的输出估计概率分布并明确估计模型的不确定性,使用一种特殊得分函数将这两种不确定性聚合在一起以获取每个图像的信息量分数,通过 PASCAL VOC 和 MS-COCO 数据集的实验证明了该方法在物体检测方面的有效性,性能优于单模型和多模型方法,而计算成本仅为之前方法的一小部分。
Mar, 2021
在自动驾驶数据集中,采用主动学习策略可以解决数据不平衡、冗余和高维数据的挑战。我们展示了使用信息熵查询来选择信息丰富的样本,旨在降低注释成本和提高模型性能的有效性。我们在 nuScenes 数据集上使用 BEVFusion 模型进行了实验,将主动学习与随机抽样进行比较,并证明信息熵查询在大多数案例中表现优异。该方法在减少多数类和少数类之间的性能差距方面特别有效。类别特定的分析揭示了对有限数据预算进行注释资源的有效配置,强调选择多样性和信息丰富的数据用于模型训练的重要性。我们的发现表明,在资源受限的环境中,信息熵查询是选择增强模型学习的数据的一种有前途的策略。
Jan, 2024
本研究结合活性学习和增量学习的方法,提出一种基于不确定度的适用于大多数对象检测器的主动学习度量标准,并探讨在样本选择过程中如何解决类别不平衡问题,通过系统评估在 PASCAL VOC 2012 数据集上,实现对新未标注数据集的持续探索。
Sep, 2018
我们提出了一种后期主动学习算法,该算法将基于不确定性的采样与基于多样性的采样相结合,不仅简单易实现,而且在各种数据集上都具有出色的表现,其实际应用在实际的高空图像数据集中增加了五倍的标注效率。
Sep, 2023
提出了一种新的主动学习采样策略,将不确定性和基于多样性的选择原则集成到一个联合选择目标中,通过测量所选样本的集体信息得分,有效地避免了冗余,并同时保持了高度的信息性,精选包含不同物体类型、形状和角度的数据集,在目标检测和图像分类任务中相比于随机选择降低了 20% 和 30% 的标注成本。
Jul, 2023
本论文研究了在深度神经网络模型中的主动学习,适用于诸如检测局部地表变化和地图更新等一些遥感任务,并使用各种机制捕捉和量化模型的不确定性,以选择有信息量的未标记样本进行注释,通过少量样本的标记就达到与大型训练集相同的性能的效果。
Aug, 2020
通过半监督深度学习与主动学习相结合的方法,使用尽可能少的标记样本,同时利用熵最小化对未标记样本进行训练,在 MNIST 数据集上仅使用 300 个标记样本实现 2.06% 的误差率和 1000 个标记样本实现 1.06% 的误差率。该方法可以获得高准确性的敏捷标注过程,同时节省标记成本。
Mar, 2018
本文介绍了两种度量目标假设信息量的度量方法:localization tightness 和 localization stability,这些方法可以使基于分类的主动学习算法更加有效地用于减少标注数据量以达到目标物体检测性能,实验结果表明,使用这些度量方法可以将所需标注数据量减少高达 25%。
Jan, 2018