本文证明了大多数知名损失函数的经验风险因子可分为线性项,聚合所有标签和不涉及标签的项,并且可以进一步表示为损失的和。这适用于任何RKHS中的非光滑、非凸损失。通过估计平均操作符,本研究揭示了这种分解的变量的充分统计量,并将其应用于弱监督学习。最后,本文展示了大多数损失都享有一种依赖于数据的(通过平均算子)噪声鲁棒性。
Feb, 2016
本文提出了一种基于约束空间的弱监督学习方法,将不同的弱监督信号结合起来进行训练,在文本分类和图像分类任务中优于其他方法。
Sep, 2020
本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础,通过对3个文本分类和6个对象分类任务的评估,证明了部分标注的效果可达到8.6%的平均准确率提高,进而探讨了部分标注在零样本对象分类任务中的应用以及与最新零样本学习方法相比的效果。
Jun, 2021
本文通过提出一种Leveraged Weighted损失函数,并推导出该函数的风险一致性,并在实验中得到验证,证明了其在面对部分标签学习中的高效性,从而提供了关于Leverage参数选择的指导。
本文探讨生成式建模弱监督中的新方向,即通过正则化流为每个弱标记源或标记函数估计密度,同时捕捉标记函数重叠和相关性现象,并在各种弱监督数据集上进行分析比较。结果表明,弱监督正则化流相对于标准弱监督有更好的效果。
Apr, 2022
本篇论文研究了弱监督机器学习方法,提出了利用预训练数据表示结合剪枝统计学方法选择高质量弱标签数据的子集,优化了弱监督模型的表现,提升了19%的准确率。
Jun, 2022
本文探究弱监督多标签分类任务中的噪声与过拟合问题,并提出了能够处理大损失值样本的方法,得出准确性更高的预测结果。
本文中,我们介绍了一种更优的传统标签传播算法(LPA)的分析方法,它可以利用有用的先验信息,具体而言是无标签数据上的概率假设标签。我们提供了一个误差界限,它利用了底层图形的局部几何特性和先前信息的质量。我们还提出了一个框架来整合多个来源的嘈杂信息。我们在多个基准弱监督分类任务上演示了我们的方法的能力,并展示了对现有半监督和弱监督方法的改进。
Oct, 2022
通过计算确切地设为真输出的概率,我们提出了一种统一的弱标签计数弱监督学习方法,并在三种常见的弱监督学习范例上取得了最先进或高度竞争的结果。
Nov, 2023
减少长尾数据标注成本的弱监督学习方法,有效保留了尾部样本的有监督信息,并提出了一种简单高效且具有强大理论保证的学习框架,通过对ImageNet等基准数据集的广泛实验证实了其有效性,优于最先进的弱监督方法。
Mar, 2024