本文提出一种新颖的部分标签学习框架,通过提出一种新的分类风险估计器、分析分类器一致性和建立估计误差界限来解决现有方法面对大规模数据计算复杂度瓶颈的问题,并通过实验验证其成为业界新的标杆。
Feb, 2020
本文提出了一种新的方法,采用自我训练的方式来处理部分标签数据,其中采用了基于最大无穷范数的伪标签技术来自动实现基准标签的分类,并通过使用简单的二次规划方法进行拟合优化。通过在自制和真实世界数据集上的测试,证明了所提出的方法比现有的部分标签学习方法更加有效。
Feb, 2019
本文提出了一种基于结构化预测和概念的下确界损失的统一框架,以处理一系列学习问题和损失函数中的部分标注,其中监督以包含实际标签的标签集的形式呈现,并且明确的算法可以轻松实现,并且证明了统计一致性和学习速率。实验证实所提出的方法优于常用的基准方法。
Mar, 2020
在真实应用中经常遇到标签模糊的数据,其中不同的标注者会给出冲突的类别标签。部分标签学习允许在这种弱监督的环境下训练分类器。虽然最先进的方法已经具有良好的预测性能,但它们经常受到错误校准的不确定性估计的影响。然而,拥有良好校准的不确定性估计在医学和自动驾驶等关键领域中尤为重要。本文中,我们提出了一种基于邻近 - 邻居的部分标签学习算法,利用了 Dempster-Shafer 理论。对人工和真实数据集的大量实验证明,所提出的方法提供了良好校准的不确定性估计,并取得了有竞争力的预测性能。此外,我们证明了我们的算法是风险一致的。
Feb, 2024
本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础,通过对 3 个文本分类和 6 个对象分类任务的评估,证明了部分标注的效果可达到 8.6% 的平均准确率提高,进而探讨了部分标注在零样本对象分类任务中的应用以及与最新零样本学习方法相比的效果。
Jun, 2021
研究了如何使用部分标签对神经网络进行训练,解决多标签分类中的标签不平衡问题,并提出了伪标注技术、新的损失函数和动态训练方案来优化模型性能。在多个公开数据集上进行了广泛实验,结果显示该方法优于现有的一些最先进方法,甚至在部分标注情况下超越了使用完整标签训练的方法。
Jul, 2023
本文介绍了 ProPaLL,一种新的概率方法,用于解决局部标签学习问题,相比现有方法具有简化训练过程、提高性能和适用于任何深层架构的优点。在人造和真实数据集上的实验证明,ProPaLL 比现有方法表现更好。
Aug, 2022
本文通过提出一种 Leveraged Weighted 损失函数,并推导出该函数的风险一致性,并在实验中得到验证,证明了其在面对部分标签学习中的高效性,从而提供了关于 Leverage 参数选择的指导。
通过选择性地对待未标注标签和使用针对性的非对称损失函数来处理部分注释问题,本文在多标签分类数据集上取得了最先进的结果。
Oct, 2021
本文提出了一种基于标签增强的偏标签学习方法,该方法针对实例相关性的标签进行了建模,并将标签分布作为标签增强过程的核心信息,以较高的精度训练了预测模型。