提出了一种使用部分反馈进行主动学习的方法,该方法可以解决多类别注释的实际问题,并使用抽样策略选择(示例,类)对,该方法在 Tiny ImageNet 数据集上相对于 i.i.d 基线提高了 26% 的分类精度,更低的成本。
Feb, 2018
该研究提出了一种针对深度神经网络的主动学习技术,使用一个单独的网络对样本进行评分选择,提高模型对错标记的容忍度,同时通过自监督和多任务学习等方法缓解数据不足的问题。
Oct, 2020
该研究通过将主动学习与自监督预训练相结合,并使用称为 Balanced Selection(BASE)的算法来解决类不平衡问题,提高图像分类性能,特别适用于工业级大规模数据标记和训练中。
Nov, 2021
文章提出了一种名为 WL-AC 的新型算法模板,该模板可以利用低质量的弱标注器来减少查询复杂性,同时保持所需的准确度水平。通过绕过实现假设,WL-AC 适用于许多现实世界的情况,包括随机损坏的弱标签和高维度家族的区别分类器。在经验上,我们提出了一种 WL-AC 的实现,可以在保持与被动学习相同的准确度的情况下,显著降低标签数量。
Nov, 2022
这篇论文提出了一种主动学习策略,其中数据筛选算法用于选择有用的训练样本以最小化注释成本,在六种语言中进行了广泛的实验,证明了该策略优于其他主动学习策略,并提出了在特定的输出标签对之间最大程度减少混淆的 AL 问题。
Nov, 2020
本文提出了一种新的方法,采用自我训练的方式来处理部分标签数据,其中采用了基于最大无穷范数的伪标签技术来自动实现基准标签的分类,并通过使用简单的二次规划方法进行拟合优化。通过在自制和真实世界数据集上的测试,证明了所提出的方法比现有的部分标签学习方法更加有效。
Feb, 2019
使用大型语言模型(GPT-3.5 和 GPT-4)进行标注,研究了主动学习中减少标注成本和采样效率的方法。采用混合注释策略,将可能标注错误的样本与人工注释相结合,可以在 AG 新闻和腐烂的番茄等数据集上取得与人工注释相似甚至更好的结果,证明了大型语言模型在主动学习中的准确性和成本效益。
Jan, 2024
本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础,通过对 3 个文本分类和 6 个对象分类任务的评估,证明了部分标注的效果可达到 8.6% 的平均准确率提高,进而探讨了部分标注在零样本对象分类任务中的应用以及与最新零样本学习方法相比的效果。
Jun, 2021
本文提出了一种基于对抗性学习与动态图的补充分类器方法,用于消除部分标签学习中假阳性标签的影响,并充分调查了补充标签集的有效性。实验表明,该方法在 4 个受控 UCI 数据集和 6 个真实世界数据集上具有优越性,并揭示了补充学习在部分标签学习中的实用性。
May, 2023
本文提出了一种基于标签增强的偏标签学习方法,该方法针对实例相关性的标签进行了建模,并将标签分布作为标签增强过程的核心信息,以较高的精度训练了预测模型。
Oct, 2021