通过交互查询子集示例的标签,主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析,并表明这种方法在一些情况下可以实现近乎最优的性能。
Jun, 2015
本文提出一种基于新的优化问题的主动学习算法,在流式环境下,可有效地解决任何分类器表示和分类问题,且具有高效实现的特点,并证明了该算法比现有的所有满足前两个特点的算法更为优秀,并对所有高效的主动学习算法进行了第一次实验分析,评估了它们在不同场景下的优劣。
本文介绍了最常用的分类器之一-逻辑回归的主要应用和性能,比较了不同的主动学习方法在准确性和计算成本方面的表现,并且发现最简单和最早期的主动学习方法-不确定性采样,表现优越。
Nov, 2016
本文研究了代价昂贵的标注问题,并提出了一种使用元学习技术来学习主动学习策略的模型,在池化的场景下使用。实验获得了鼓舞人心的结果。
Jun, 2017
本文研究了如何在不可靠的情况下评估主动学习算法在训练期间的性能,并提出了三个主要挑战:如何推导性能分布,如何保留标记子集的代表性,以及如何纠正由于智能选择策略而引起的抽样偏差。
Jan, 2019
本研究开发了一种基于支持向量分类的基础池式主动学习器的快速简单的实践方法,旨在解决很少标记数据点的情况下进行模型选择的挑战,并通过加权方法让模型在易于分类数据集和难以分类数据集之间取得平衡的最佳性能。
Dec, 2021
提出一种基于主动规划神经网络的在线决策树构建方法,利用自适应子模性来选择获取具有最小代价的特征值,通过后验采样算法降低在线预测误差,对各种现实世界中的数据集进行了广泛的实验,并在概念漂移的情况下展示其有效性和灵活性。
May, 2023
本研究探讨了基于提升树的主动学习方法对表格数据的有效性,利用模型不确定性进行样本选择,并针对回归任务提出了一种成本效益高的主动学习方法,同时也提出了改进的成本效益高的分类任务的主动学习方法。
Oct, 2023
主要介绍了主动学习策略在解决二分类问题中的应用,提出了一种基于偏移正态分布采样函数的方法,通过限制噪声和正类标签选择,提高了20%到32%的成本效率。
Mar, 2024
本研究提出了一种新的主动学习方法SUPClust,旨在识别类别之间的决策边界上的点,通过针对这些点收集最具信息性以优化模型对复杂决策区域的预测,实验证明标记这些点可以显著提高模型性能,即使在强类别不平衡的情况下。