特征混合的主动学习

Mar, 2022

Active Learning by Feature Mixing

Amin Parvaneh, Ehsan Abbasnejad, Damien Teney, Reza Haffari, Anton van den Hengel...

TL;DR提出了一种名为ALFA-Mix的新型批量主动学习方法，它利用分析未标记实例的预测结果中的不一致性来确定具有足够明显特征的实例，证明该方法在图像、视频和非视觉数据的12个基准测试中，在30种不同的设置中优于所有其它主动学习方法，特别是在低数据量情况和自训练视觉转换器方面，ALFA-Mix 的性能优于该领域现有技术的59％和43％。

Abstract

The promise of active learning (AL) is to reduce labelling costs by selecting the most valuable examples to annotate from a pool of unlabelled data. Identifying these examples is especially challenging with high-dimensi

发现论文，激发创造

深度主动学习反思：在模型训练中利用未标记数据

该研究提出了在主动学习的过程中既利用有标签的数据，也利用无标签的数据进行模型训练的方法，并使用了无监督特征学习和半监督学习的技术，研究表明使用无标签数据进行模型训练在图像分类任务中可以带来比不同获取策略更高的准确度，因此可以得到更小的标签预算。

Nov, 2019

结合 MixMatch 和主动学习以在更少的标签下实现更高准确度

使用基于主动学习技术的方法改进了半监督学习 MixMatch 算法，并在 CIFAR-10、CIFAR-100 和 SVHN 数据集上进行了全面的实证评估，得到了显著的性能提升。此外，还对标记和非标记数据成本之间的权衡进行了实证分析，发现虽然有标记数据的增量效益可以高达非标记数据的 20 倍，但一旦观察到超过 2000 个标记示例，其效益就会迅速减弱到不到 3 倍。

Dec, 2019

神经网络比人类评分者更具生产力: 活跃混合用于从黑盒模型中进行数据效率知识蒸馏

本研究探讨如何使用知识蒸馏从黑盒模型中训练神经网络进行视觉识别，使用混合和主动学习等方法，从而在节省计算和数据集成本的同时保持高性能。

Mar, 2020

Ask-n-Learn：基于可靠梯度表示的主动学习图像分类

本论文提出了一种基于梯度嵌入和预测校准的主动学习方法Ask-n-Learn，结合数据扩增缓解伪标注期间的确认偏差，通过对基准图像分类任务（CIFAR-10，SVHN，Fashion-MNIST，MNIST）的经验研究，证明了该方法优于最近提出的BADGE算法等现有基线。

Sep, 2020

基于预设文本的主动学习

该研究提出了一种针对深度神经网络的主动学习技术，使用一个单独的网络对样本进行评分选择，提高模型对错标记的容忍度，同时通过自监督和多任务学习等方法缓解数据不足的问题。

Oct, 2020

深度主动学习在图像分类任务中的有效评估

本文旨在探讨如何通过主动学习（AL）技术实现更高效的标签操作的问题，其中包括一些在目前文献中存在的问题，如数据增强方法和SGD等常见方法的应用等，通过在图像分类中新的开源AL工具DISTIL的统一重新实现，我们研究了这些问题，并提出了一些第一手的洞察，以供AL从业者在未来的工作中参考。

Jun, 2021

减少标注工作量：自监督活跃学习相遇

本研究针对减少标注工作的两种范式：主动学习和自学习，研究它们能否相互受益。在对象识别数据集（包括CIFAR10、CIFAR100和Tiny ImageNet）上的实验证明：对于低的标注预算，主动学习对自学习没有帮助。当标注预算很高时，主动学习和自学习的组合是有益的。

Aug, 2021

低预算主动学习的简单基线

本篇研究利用自我监督学习方法提取丰富特征，并研究了针对低标记预算下不同采样策略的有效性，表明虽然主流主动学习方法在高标记预算下表现出色，但简单的K均值聚类方法在低预算下可以胜任，并可作为图像分类低预算主动学习的基线方法。

Oct, 2021

ImageNet 规模下的主动学习

该研究通过将主动学习与自监督预训练相结合，并使用称为Balanced Selection（BASE）的算法来解决类不平衡问题，提高图像分类性能，特别适用于工业级大规模数据标记和训练中。

Nov, 2021

复合主动学习：具备理论保证的多域主动学习

该研究提出了一种名为复合主动学习（CAL）的通用方法，用于多领域主动学习（AL）中，以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题，并在理论和实证结果上显示出优于现有方法的性能。

Feb, 2024