来自弱和强标注者的主动学习
文章提出了一种名为 WL-AC 的新型算法模板,该模板可以利用低质量的弱标注器来减少查询复杂性,同时保持所需的准确度水平。通过绕过实现假设,WL-AC 适用于许多现实世界的情况,包括随机损坏的弱标签和高维度家族的区别分类器。在经验上,我们提出了一种 WL-AC 的实现,可以在保持与被动学习相同的准确度的情况下,显著降低标签数量。
Nov, 2022
我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系,并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别,我们展示了更强的结果,包括计算效率和对未知数据集的适应性。
May, 2024
提出了一种能够在只有单类样本和无标签数据的情况下运作的主动学习算法,该方法通过分别估计正样本和未标记点的概率密度,计算信息性的期望值以获取更好的信息性度量。与其他类似方法相比,实验和经验分析结果表现出有前途的结果。
Feb, 2016
本文介绍了一种新的机器学习辅助标注方法,即 Active WeaSuL。该方法使用专家定义的规则来估算整个数据集的概率标签,并在弱监督模型容易出错的几个点上迭代提供真实标签以优化模型性能。实验证明,Active WeaSuL 比其他方法更适用于获取标记数据困难的情况下。
Apr, 2021
提出了一种使用部分反馈进行主动学习的方法,该方法可以解决多类别注释的实际问题,并使用抽样策略选择(示例,类)对,该方法在 Tiny ImageNet 数据集上相对于 i.i.d 基线提高了 26% 的分类精度,更低的成本。
Feb, 2018
该研究提出了一种针对深度神经网络的主动学习技术,使用一个单独的网络对样本进行评分选择,提高模型对错标记的容忍度,同时通过自监督和多任务学习等方法缓解数据不足的问题。
Oct, 2020
该文针对主动覆盖问题,借助支持向量估计器等算法在无标签数据集上提出了在少量标签查询即可完成标记所有阳性样本的主动学习方法,并证明该方法在图像数据集等基准测试中取得了相对优于离线方法和基线算法的效果。
Jun, 2021
本文提出一个算法,利用一种 “从一致的主动学习到具有保证错误的置信度评估预测” 的减少,以及一种新颖的置信度评估预测器解决了确保标签复杂度更低的主动学习问题。
Jul, 2014