CALICO:集成校准的自信主动学习
本文提出一种新的主动学习算法,将 CNN 模型的输出从 softmax 替换为 Dirichlet 值,实现从未标记数据中提取最具信息量的标记数据集,该方法在多项数据集和医学图像识别领域中与其他主动学习方法相比均具有更高的性能表现和易于实现且不需要大量计算资源的优点。
Jul, 2020
本论文提出了一种基于梯度嵌入和预测校准的主动学习方法 Ask-n-Learn,结合数据扩增缓解伪标注期间的确认偏差,通过对基准图像分类任务(CIFAR-10,SVHN,Fashion-MNIST,MNIST)的经验研究,证明了该方法优于最近提出的 BADGE 算法等现有基线。
Sep, 2020
本文提出了一种新颖的自适应基于聚类的主动学习算法 D-CALM,通过将聚类与主动学习相结合,动态地调整聚类和注释工作以响应分类器错误率的估计。实验证明,D-CALM 可以显著优于基线主动学习方法,具有较强的鲁棒性并可以显著降低模型的不想要偏差。
May, 2023
本文提出了一种新的主动学习框架,通过有限量的标签训练实例以增量学习的方式构建具有最佳特征表示的竞争性分类器。该方法利用深度卷积神经网络进行主动学习,设计了一种成本效益的样本选择策略,通过选取高置信度的无标签样本自动迭代分配伪标签来改善分类性能。实验证明,该框架在人脸识别和物体分类等两个数据集上取得了有希望的成果。
Jan, 2017
提出了一种名为 “Cartography Active Learning”(CAL) 的主动学习算法,该算法通过利用模型在单个实例上的行为作为代理来查找最具信息价值的实例进行标注。与其他常用的 AL 策略相比,CAL 是一种更有效的学习策略,可以通过利用小种子数据产生的训练动态来成功地进行 AL。
Sep, 2021
Focused Active Learning combines Bayesian Neural Network with Out-of-Distribution detection to estimate different uncertainties for acquisition and outperforms existing methods for prostate cancer classification.
Apr, 2024
本文提出了一种基于混合密度网络的深度主动学习方法,该方法通过对定位和分类器的输出估计概率分布并明确估计模型的不确定性,使用一种特殊得分函数将这两种不确定性聚合在一起以获取每个图像的信息量分数,通过 PASCAL VOC 和 MS-COCO 数据集的实验证明了该方法在物体检测方面的有效性,性能优于单模型和多模型方法,而计算成本仅为之前方法的一小部分。
Mar, 2021
该研究提出了一种名为复合主动学习(CAL)的通用方法,用于多领域主动学习(AL)中,以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题,并在理论和实证结果上显示出优于现有方法的性能。
Feb, 2024
该研究通过将主动学习与自监督预训练相结合,并使用称为 Balanced Selection(BASE)的算法来解决类不平衡问题,提高图像分类性能,特别适用于工业级大规模数据标记和训练中。
Nov, 2021