基于预设文本的主动学习
该研究提出了在主动学习的过程中既利用有标签的数据,也利用无标签的数据进行模型训练的方法,并使用了无监督特征学习和半监督学习的技术,研究表明使用无标签数据进行模型训练在图像分类任务中可以带来比不同获取策略更高的准确度,因此可以得到更小的标签预算。
Nov, 2019
本文提出一种新的主动学习算法,将 CNN 模型的输出从 softmax 替换为 Dirichlet 值,实现从未标记数据中提取最具信息量的标记数据集,该方法在多项数据集和医学图像识别领域中与其他主动学习方法相比均具有更高的性能表现和易于实现且不需要大量计算资源的优点。
Jul, 2020
本研究提供了一个将自我监督预训练、主动学习和一致性正则化自我训练整合的新算法框架,并在CIFAR10和CIFAR100数据集上进行了实验,揭示了自我监督预训练在半监督学习中的重要性,被S4L技术所替代的主动学习的价值。
Nov, 2020
本文旨在探讨如何通过主动学习(AL)技术实现更高效的标签操作的问题,其中包括一些在目前文献中存在的问题,如数据增强方法和SGD等常见方法的应用等,通过在图像分类中新的开源AL工具DISTIL的统一重新实现,我们研究了这些问题,并提出了一些第一手的洞察,以供AL从业者在未来的工作中参考。
Jun, 2021
本文提出了一种利用时间输出差异度来估计样本损失的深度主动学习方法,该方法可以从未标注的数据中选择最具信息量的样本,并且在图像分类和语义分割任务上相较于最先进的主动学习方法取得了更好的性能。
Jul, 2021
本研究针对减少标注工作的两种范式:主动学习和自学习,研究它们能否相互受益。在对象识别数据集(包括CIFAR10、CIFAR100和Tiny ImageNet)上的实验证明:对于低的标注预算,主动学习对自学习没有帮助。当标注预算很高时,主动学习和自学习的组合是有益的。
Aug, 2021
本文提出一种创新的主动学习方法,利用自监督的预训练任务和独特的数据采样器,通过选择具有难度和代表性的数据来解决数据标注代价高的问题,并在各种图像分类和分割基准上取得了令人信服的性能。
Jan, 2022
通过Positive Active Learning策略,可以扩展自我监督学习(SSL)到在线学习,半监督和监督学习。该框架可嵌入先验知识并提供主动学习框架,从而实现低成本对数据集的注释。
Mar, 2023
该研究提出了一种名为复合主动学习(CAL)的通用方法,用于多领域主动学习(AL)中,以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题,并在理论和实证结果上显示出优于现有方法的性能。
Feb, 2024