主动学习的极小极大分析

Oct, 2014

Minimax Analysis of Active Learning

Steve Hanneke, Liu Yang

TL;DR该研究通过各种噪声模型，建立了关于利用一般假设类进行主动学习的最小极大标签复杂性的无分布上限和下限。结果表明，利用 VC 类进行主动学习的最小极大标签复杂性始终比被动学习的复杂性小。在噪声高的情况下，给定 VC 维数的所有主动学习问题都具有大致相同的最小极大标签复杂度，而在噪声低的情况下，标签复杂性可以用一个称为「星号数」的简单组合复杂度衡量。

Abstract

This work establishes distribution-free upper and lower bounds on the minimax label complexity of active learning with general hypothesis classes, under various →

active learning noise models label complexity vc class combinatorial complexity

发现论文，激发创造

极小 - 极大主动学习

该研究发展了一种基于半监督极小极大熵的主动学习算法，通过同时利用不确定性和多样性来选择最具代表性的样本，从而在图像分类和语义分割任务中表现优于现有的技术。

Dec, 2020

基于 Margin 的噪声自适应主动学习及在 Tsybakov 噪声条件下的下界

提出了一个简单的噪声 - 鲁棒性基于边缘的主动学习算法来查找同质 (通过原点) 的线性分离器，并分析了标签受噪声干扰时的误差收敛性。我们证明了当所施加的噪声满足 Tsybakov 低噪声条件时，算法能够适应未知的噪声水平，并在多对数因子上实现最优统计速率。同时，我们为基于边缘的主动学习算法在会员查询合成场景下的 Tsybakov 噪音条件 (TNC) 导出了下限。我们的分析可能为其他形式的下限提供了见解。

Jun, 2014

简单问题的主动学习

我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系，并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别，我们展示了更强的结果，包括计算效率和对未知数据集的适应性。

May, 2024

带成本的平均情况主动学习

对一种贪心主动学习算法的期望成本进行了分析，如使用标签成本的活跃学习，适用于多类和部分标签查询的活跃学习，以及批处理模式的活跃学习。

May, 2009

使用比较查询进行主动分类

研究一种扩展主动学习的方法，其中学习算法可以要求注释者比较两个示例与其标签类边界的距离，并使用半空间的框架展示这种方法的优越性。

Apr, 2017

噪声容忍和差分隐私的统计主动学习算法

提出一种基于统计学习框架的主动学习算法，能够高效地处理随机分类噪声和差分隐私，且可将其转换为能容忍分类噪声的主动学习算法，同时也实现了用指数级别的误差提高标签节约的差分隐私主动学习算法.

Jul, 2013

嘈杂贝叶斯主动学习

本文提出了一种基于最大化外部 Jensen-Shannon 分歧的标签查询采样策略，用于噪声贝叶斯主动学习中的真实标签生成函数的识别，并提供了上下界，表现优于以往的方法。

Dec, 2013

不可知的多组主动学习

本论文提出了一种用于多组学习的主动学习算法，以最小化标签查询数并保持 PAC 学习保证，其中包括分类准确度，标签查询和不一致系数等关键词。

Jun, 2023

非参数主动学习用于成本敏感分类

设计了一种用于成本敏感分类的通用非参数主动学习算法，通过构建每个标签的预测成本函数的置信区间，该算法选择最具信息量的向量点，通过仅查询可能是最小的预测成本来与其交互，证明了该算法在与向量空间的交互数量方面达到了最优收敛速率，并且在对 Tsybakov 的噪声假设的一般版本中，通过边界决策的概率质量明确表征了相对于相应被动学习方法的收益，并且通过提供匹配的（仅差对数因子的）下界证明了获得上界的接近最优性。

Sep, 2023

主动学习中的收敛速度

该研究通过研究标签噪声下主动学习的泛化误差收敛速率等方面，探究了嵌套假设类的主动学习的模型选择问题，并提出了一种算法，该算法的错误率保证收敛于最优分类器的可达误差，并定义了实现这些速率显著快于被动学习的充分条件。

Mar, 2011