CALICO：集成校准的自信主动学习

Jul, 2024

CALICO: Confident Active Learning with Integrated Calibration

Lorenzo S. Querol, Hajime Nagahara, Hideaki Hayashi

TL;DR提出了一种称为 CALICO 的主动学习框架，通过联合训练分类器和基于能量的模型来实现自校准的置信度，进而提高分类性能。

Abstract

The growing use of deep learning in safety-critical applications, such as medical imaging, has raised concerns about limited labeled data, where this demand is amplified as model complexity increases, posing hurdles for domain experts to annotate data. In response to this,

deep learning active learning calibration confidence classification performance

发现论文，激发创造

DEAL: 图像分类的深度证据主动学习

本文提出一种新的主动学习算法，将 CNN 模型的输出从 softmax 替换为 Dirichlet 值，实现从未标记数据中提取最具信息量的标记数据集，该方法在多项数据集和医学图像识别领域中与其他主动学习方法相比均具有更高的性能表现和易于实现且不需要大量计算资源的优点。

Jul, 2020

Ask-n-Learn：基于可靠梯度表示的主动学习图像分类

本论文提出了一种基于梯度嵌入和预测校准的主动学习方法 Ask-n-Learn，结合数据扩增缓解伪标注期间的确认偏差，通过对基准图像分类任务（CIFAR-10，SVHN，Fashion-MNIST，MNIST）的经验研究，证明了该方法优于最近提出的 BADGE 算法等现有基线。

Sep, 2020

D-CALM：基于动态聚类的主动学习方法降低偏差

本文提出了一种新颖的自适应基于聚类的主动学习算法 D-CALM，通过将聚类与主动学习相结合，动态地调整聚类和注释工作以响应分类器错误率的估计。实验证明，D-CALM 可以显著优于基线主动学习方法，具有较强的鲁棒性并可以显著降低模型的不想要偏差。

May, 2023

深度图像分类的成本效益主动学习

本文提出了一种新的主动学习框架，通过有限量的标签训练实例以增量学习的方式构建具有最佳特征表示的竞争性分类器。该方法利用深度卷积神经网络进行主动学习，设计了一种成本效益的样本选择策略，通过选取高置信度的无标签样本自动迭代分配伪标签来改善分类性能。实验证明，该框架在人脸识别和物体分类等两个数据集上取得了有希望的成果。

Jan, 2017

地图学主动学习

提出了一种名为 “Cartography Active Learning”(CAL) 的主动学习算法，该算法通过利用模型在单个实例上的行为作为代理来查找最具信息价值的实例进行标注。与其他常用的 AL 策略相比，CAL 是一种更有效的学习策略，可以通过利用小种子数据产生的训练动态来成功地进行 AL。

Sep, 2021

针对组织病理图像分类的专注主动学习

Focused Active Learning combines Bayesian Neural Network with Out-of-Distribution detection to estimate different uncertainties for acquisition and outperforms existing methods for prostate cancer classification.

Apr, 2024

基于概率建模的深度目标检测主动学习

本文提出了一种基于混合密度网络的深度主动学习方法，该方法通过对定位和分类器的输出估计概率分布并明确估计模型的不确定性，使用一种特殊得分函数将这两种不确定性聚合在一起以获取每个图像的信息量分数，通过 PASCAL VOC 和 MS-COCO 数据集的实验证明了该方法在物体检测方面的有效性，性能优于单模型和多模型方法，而计算成本仅为之前方法的一小部分。

Mar, 2021

复合主动学习：具备理论保证的多域主动学习

该研究提出了一种名为复合主动学习（CAL）的通用方法，用于多领域主动学习（AL）中，以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题，并在理论和实证结果上显示出优于现有方法的性能。

Feb, 2024

面向可计算的深度主动学习

该研究介绍了两种用于文本分类和标记任务的技术，可以显著减少深度学习中主动学习繁重的计算资源需求，通过伪标签和蒸馏模型实现更高性能的模型训练。

May, 2022

ImageNet 规模下的主动学习

该研究通过将主动学习与自监督预训练相结合，并使用称为 Balanced Selection（BASE）的算法来解决类不平衡问题，提高图像分类性能，特别适用于工业级大规模数据标记和训练中。

Nov, 2021