本文探讨了一种在拥有弱标注者和强标注者存在的情况下进行主动学习的算法,旨在学习一个在正确标注数据上误差较小的分类器,同时通过弱标注者减少标注者的查询次数,从而降低标注的成本。我们提出了一种主动学习算法,并建立了其统计一致性,分析了其标注复杂性,以便表明是否能够在使用强标注者的基础上节约标注成本。
Oct, 2015
文章提出了一种基于多任务弱监督的矩阵补全方法, 通过建立弱监督任务之间的相关性解决弱监督准确性低的问题, 从而提高模型训练的效果。实验结果表明, 与传统的有监督方法相比, 该方法能平均提高 20.2% 的准确率。
Oct, 2018
该研究论文展开了交互式弱监督学习框架的研究,该框架中,方法提议启发式方法并从用户每个被提议的启发式反馈中学习,其实验表明只需要少量的反馈迭代就可以训练模型达到高竞争的测试集性能,而不需要访问本文中使用的标签数据。
Dec, 2020
本研究针对减少标注工作的两种范式:主动学习和自学习,研究它们能否相互受益。在对象识别数据集(包括CIFAR10、CIFAR100和Tiny ImageNet)上的实验证明:对于低的标注预算,主动学习对自学习没有帮助。当标注预算很高时,主动学习和自学习的组合是有益的。
Aug, 2021
本篇论文研究了弱监督机器学习方法,提出了利用预训练数据表示结合剪枝统计学方法选择高质量弱标签数据的子集,优化了弱监督模型的表现,提升了19%的准确率。
Jun, 2022
本文中,我们介绍了一种更优的传统标签传播算法(LPA)的分析方法,它可以利用有用的先验信息,具体而言是无标签数据上的概率假设标签。我们提供了一个误差界限,它利用了底层图形的局部几何特性和先前信息的质量。我们还提出了一个框架来整合多个来源的嘈杂信息。我们在多个基准弱监督分类任务上演示了我们的方法的能力,并展示了对现有半监督和弱监督方法的改进。
Oct, 2022
文章提出了一种名为WL-AC的新型算法模板,该模板可以利用低质量的弱标注器来减少查询复杂性,同时保持所需的准确度水平。通过绕过实现假设,WL-AC适用于许多现实世界的情况,包括随机损坏的弱标签和高维度家族的区别分类器。在经验上,我们提出了一种WL-AC的实现,可以在保持与被动学习相同的准确度的情况下,显著降低标签数量。
Nov, 2022
本文提出一种基于 (heuristics) 启发式规则构造损失函数 (loss functions) 的弱监督学习 (weak supervision) 方法,命名为 'Losses over Labels (LoL)',可以更多地利用启发式规则中专家知识和判断依据进行训练,有效提高文本和图像分类任务中的性能。
Dec, 2022
利用未标记的样本空间,我们提出了两种新的注释统一算法,旨在解决主动学习中存在的错误数据标注问题,并通过在四个公共数据集上的实验证明该方法在评估标注者可靠性和分配实际标签方面的鲁棒性和优越性,超过了现有算法和简单的多数投票。
Jul, 2023
提出ActiveDP框架,结合主动学习和数据编程,生成高准确性和覆盖率的标签,优于以往弱监督和主动学习方法,在不同标注预算下表现稳定。
Feb, 2024