该研究提出了在主动学习的过程中既利用有标签的数据,也利用无标签的数据进行模型训练的方法,并使用了无监督特征学习和半监督学习的技术,研究表明使用无标签数据进行模型训练在图像分类任务中可以带来比不同获取策略更高的准确度,因此可以得到更小的标签预算。
Nov, 2019
使用基于主动学习技术的方法改进了半监督学习 MixMatch 算法,并在 CIFAR-10、CIFAR-100 和 SVHN 数据集上进行了全面的实证评估,得到了显著的性能提升。此外,还对标记和非标记数据成本之间的权衡进行了实证分析,发现虽然有标记数据的增量效益可以高达非标记数据的 20 倍,但一旦观察到超过 2000 个标记示例,其效益就会迅速减弱到不到 3 倍。
Dec, 2019
本研究探讨如何使用知识蒸馏从黑盒模型中训练神经网络进行视觉识别,使用混合和主动学习等方法,从而在节省计算和数据集成本的同时保持高性能。
Mar, 2020
本论文提出了一种基于梯度嵌入和预测校准的主动学习方法Ask-n-Learn,结合数据扩增缓解伪标注期间的确认偏差,通过对基准图像分类任务(CIFAR-10,SVHN,Fashion-MNIST,MNIST)的经验研究,证明了该方法优于最近提出的BADGE算法等现有基线。
Sep, 2020
该研究提出了一种针对深度神经网络的主动学习技术,使用一个单独的网络对样本进行评分选择,提高模型对错标记的容忍度,同时通过自监督和多任务学习等方法缓解数据不足的问题。
Oct, 2020
本文旨在探讨如何通过主动学习(AL)技术实现更高效的标签操作的问题,其中包括一些在目前文献中存在的问题,如数据增强方法和SGD等常见方法的应用等,通过在图像分类中新的开源AL工具DISTIL的统一重新实现,我们研究了这些问题,并提出了一些第一手的洞察,以供AL从业者在未来的工作中参考。
Jun, 2021
本研究针对减少标注工作的两种范式:主动学习和自学习,研究它们能否相互受益。在对象识别数据集(包括CIFAR10、CIFAR100和Tiny ImageNet)上的实验证明:对于低的标注预算,主动学习对自学习没有帮助。当标注预算很高时,主动学习和自学习的组合是有益的。
Aug, 2021
本篇研究利用自我监督学习方法提取丰富特征,并研究了针对低标记预算下不同采样策略的有效性,表明虽然主流主动学习方法在高标记预算下表现出色,但简单的K均值聚类方法在低预算下可以胜任,并可作为图像分类低预算主动学习的基线方法。
Oct, 2021
该研究通过将主动学习与自监督预训练相结合,并使用称为Balanced Selection(BASE)的算法来解决类不平衡问题,提高图像分类性能,特别适用于工业级大规模数据标记和训练中。
Nov, 2021
该研究提出了一种名为复合主动学习(CAL)的通用方法,用于多领域主动学习(AL)中,以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题,并在理论和实证结果上显示出优于现有方法的性能。
Feb, 2024