一种可扩展的主动学习算法
通过交互查询子集示例的标签,主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析,并表明这种方法在一些情况下可以实现近乎最优的性能。
Jun, 2015
本文提出一种基于新的优化问题的主动学习算法,在流式环境下,可有效地解决任何分类器表示和分类问题,且具有高效实现的特点,并证明了该算法比现有的所有满足前两个特点的算法更为优秀,并对所有高效的主动学习算法进行了第一次实验分析,评估了它们在不同场景下的优劣。
Jun, 2015
本文介绍了最常用的分类器之一-逻辑回归的主要应用和性能,比较了不同的主动学习方法在准确性和计算成本方面的表现,并且发现最简单和最早期的主动学习方法-不确定性采样,表现优越。
Nov, 2016
研究了一种高效的批量主动学习算法,该算法结合不确定性和多样性概念,在批量设置中易于扩展,并与先前研究中使用的批量大小(100K-1M)相比提高模型训练效率。同时,还证明了相关采样方法的标签复杂度保证,该方法在特定情况下几乎等同于我们的采样方法。
Jul, 2021
该研究通过将主动学习与自监督预训练相结合,并使用称为Balanced Selection(BASE)的算法来解决类不平衡问题,提高图像分类性能,特别适用于工业级大规模数据标记和训练中。
Nov, 2021
本研究开发了一种基于支持向量分类的基础池式主动学习器的快速简单的实践方法,旨在解决很少标记数据点的情况下进行模型选择的挑战,并通过加权方法让模型在易于分类数据集和难以分类数据集之间取得平衡的最佳性能。
Dec, 2021
使用包装器主动学习方法对分类问题进行改进,通过在初始标记样本上构建分类树,将空间分解为低熵区域,再使用基于输入空间的准则从这些区域中进行子采样,并证明了该方法在使用受限标记数据集时构建准确分类模型的有效性。
Apr, 2024
通过在活动学习(AL)框架内应用参数高效微调方法对极限预算限制的分类任务中的采样选择过程进行研究,本研究展示了基础视觉转换模型在图像数据集上表现出色的少样本性能,并突出显示了将参数高效微调方法与基础模型相结合的战略优势,从而改进了这些具有挑战性的数据集上的活动学习性能,为优化AL策略做出了贡献,并为在专业领域高效和有效地进行数据注释提供了有前景的研究方向。
Jun, 2024
本研究解决了使用多项逻辑回归进行多类分类的主动学习中的理论与算法问题。我们提出了一种新颖的主动学习算法FIRAL,通过后悔最小化策略来降低Fisher信息比率,并在实验中验证其在分类错误率方面优于其他五种方法,展示了其在多类逻辑回归设置下的有效性。
Sep, 2024