使用比较查询进行主动分类
我们提出了一种基于池泛型主动学习的不同工具,该工具基于学习器计算假设损失和某个固定“关键”假设之间差异的估计器能力,进而得到一些显著意义上的主动学习界限,尤其对于那些只依赖于不一致性系数限制的方法在某些问题上无法提供有用边界的情况下。
Oct, 2011
研究池化主动学习半平面问题,重点挖掘了实现的情况下侵略性方法的可行性及其理论保证,证明在合理假设下其具有实用性;理论和实验结果显示此方法比较温和的方法更具优势,可以更好降低标签复杂度,不仅阐述了实现的情况下其近似保证,还说明了相应启发式策略在其他情况下也可以成功使用。
Aug, 2012
研究活动学习的算法,其中标签器不仅可以返回不正确的标签,还可以放弃标记,利用放弃响应提出的算法在噪声和放弃率的自然假设下分析了其统计一致性和查询复杂度,并与下限相结合,证明在某些技术条件下,它实现了近乎最佳的查询复杂度 。
Oct, 2016
研究提出一种新的主动学习框架,称为Active Learning++,其可以利用注释者的标签以及其理由,通过修改基于Bagging的Query by Committee (QBC)采样策略的不一致度量方法,将委员会模型的权重分配给具有更高一致性的注释者排序的委员会模型,在模拟研究中表明该框架显著优于QBC based vanilla AL framework。
Sep, 2020
本文基于两种算法(一个可直接恢复出真实标签,另一个则可以在标注标签子集的情况下可靠地推断出大型实例集的真实标签)从而开发利用配对比较查询可在指数级减少标签复杂性的方法,用于众包PAC学习阈值函数的设定,并在保留整体查询复杂性和运行时间的同时,可以成功地处理来自可能反对者的注释。
Nov, 2020
该文针对主动覆盖问题,借助支持向量估计器等算法在无标签数据集上提出了在少量标签查询即可完成标记所有阳性样本的主动学习方法,并证明该方法在图像数据集等基准测试中取得了相对优于离线方法和基线算法的效果。
Jun, 2021
提供了一种公平比较不同任务和领域中算法的主动学习框架,并提出了一种快速有效的评估算法。汇总了在3个主要领域(表格、图像和文本)上使用的6种广泛应用的算法在7个实际数据集和2个合成数据集上的实证结果,并形成了领域特定的主动学习算法排名。
Nov, 2023
我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系,并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别,我们展示了更强的结果,包括计算效率和对未知数据集的适应性。
May, 2024