DIRECT: 不平衡和标签噪音下的深度主动学习
本文提出一种新的主动学习算法,将 CNN 模型的输出从 softmax 替换为 Dirichlet 值,实现从未标记数据中提取最具信息量的标记数据集,该方法在多项数据集和医学图像识别领域中与其他主动学习方法相比均具有更高的性能表现和易于实现且不需要大量计算资源的优点。
Jul, 2020
主要介绍了主动学习策略在解决二分类问题中的应用,提出了一种基于偏移正态分布采样函数的方法,通过限制噪声和正类标签选择,提高了 20% 到 32% 的成本效率。
Mar, 2024
本研究提出了一种新的主动学习方法,通过对比学习在特征空间中选择集群的样本,从标记和未标记的数据池中获取信息,以获取优先的显着内部分布样本,并证明该方法相对于现有的主动学习方法需要更少的标注预算才能达到相同的准确性水平。
Mar, 2023
本研究结合活性学习和增量学习的方法,提出一种基于不确定度的适用于大多数对象检测器的主动学习度量标准,并探讨在样本选择过程中如何解决类别不平衡问题,通过系统评估在 PASCAL VOC 2012 数据集上,实现对新未标注数据集的持续探索。
Sep, 2018
该研究提出了一种基于最小不一致度量的主动学习方法,通过计算预测标签的最小不一致概率来选择查询无标签数据,实验结果表明该方法在多个数据集和深度架构上均获得了领先的性能。
Jan, 2024
提出一种新的批次模式主动学习算法 —— 判别式主动学习法(DAL),并将其应用在神经网络和大批次查询的情境中,尝试通过将标记集合和未标记的数据池区分开来作为选择样本的依据来执行主动学习,结果表明我们的方法在中等和大批次查询中与最先进的方法相当,并且在实现简单的同时还可以扩展到除分类任务之外的其他领域,同时,我们的实验还表明在相对较大的批次中,当批量大小较大时,当前现有的最先进方法均不比不确定性采样明显更好,从而推翻了一些最近文献中报道的结果。
Jul, 2019
通过自监督学习获取特征,利用聚类距离差异度量标识多样的数据,进而构建自适应子集来平衡多样和不确定的数据,该方法相对于已有的主流主动学习方法在广泛认可的基准测试上提高了 1.20% 的性能,同时在更大和更小的标注预算下也验证了该方法的有效性
Dec, 2023
该研究致力于解决减少有标签的训练数据来训练监督式分类模型的问题,通过使用 Active Learning 和 K-means 聚类算法,采用 mini-batch Active Learning 方法来快速有效地选取对模型具有信息量和多样性的训练样例,以达到相当或更好的性能表现。
Jan, 2019