组合覆盖下的主动学习
该论文研究了主动学习中困难的预测模型选择问题,并提出一种基于模型探针(model probes)的方法Biased-Robin Algorithm,能够在相同成本和先验概率下有效地选择模型。
Jul, 2012
本文介绍了一种新的样本效率模型评估框架——主动测试,通过精心选择要标记的测试点,以充分利用样本,解决了现有文献大都忽略了标记测试数据的成本,从而导致模型评估与实际应用的脱节的问题,在理论上建立了基于目标的获取策略并做了进一步的改进,以消除引入的偏差并在相同时间内降低估计方差。
Mar, 2021
该文针对主动覆盖问题,借助支持向量估计器等算法在无标签数据集上提出了在少量标签查询即可完成标记所有阳性样本的主动学习方法,并证明该方法在图像数据集等基准测试中取得了相对优于离线方法和基线算法的效果。
Jun, 2021
本文在 batch active learning 场景下,提出了一种解决 informativeness 和 diversity 之间权衡问题的算法,理论上可以在 pool-based active learning 中得到最优结果,并且这也是第一篇使用这种方式明确量化在 pool-based 场景中 batch active learning 统计表现的论文。
Feb, 2022
我们研究了自适应组合最大化问题,在机器学习中是一个核心挑战,并应用于主动学习以及其他许多领域。我们研究贝叶斯设置下,考虑最大化目标在基数约束和最小成本覆盖下。我们提供了新的综合近似保证,包括之前的结果,并且更加加强了它们。我们的近似保证同时支持最大增益比以及接近次模效用函数,包括了在基数约束和最小成本覆盖下的最大化保证。此外,我们对一种修改后的先验提供了近似保证,这对于获得独立于先验最小概率的主动学习保证至关重要。此外,我们发现了一种自适应选择策略的新参数,称之为“最大增益比”。我们展示了这个参数比之前近似保证中使用的贪婪近似参数要更加宽松,并展示了它可以提供比之前结果更强的近似保证。特别地,我们展示了最大增益比永远不会大于策略的贪婪近似因子,并且它可以大为缩小。这为自适应组合最大化中有用的策略特性提供了新的见解。
Apr, 2024
使用包装器主动学习方法对分类问题进行改进,通过在初始标记样本上构建分类树,将空间分解为低熵区域,再使用基于输入空间的准则从这些区域中进行子采样,并证明了该方法在使用受限标记数据集时构建准确分类模型的有效性。
Apr, 2024
使用成员预测器解决未知线性约束的组合优化问题,以学习和利用替代线性约束的新框架,并通过采样策略和解决0-1整数线性规划来选择需要标记的新点,以提高结果的质量。
May, 2024
在低预算环境中,通过对半径超参数进行优化,我们提出了MaxHerding方法作为ProbCover方法的泛化理论,该方法表现出较好的性能,并且在多种低预算图像分类基准下比现有的主动学习方法计算成本更低。
Jul, 2024