本文提出了一种利用结构因果模型的生成方法来应对标签噪声的问题,证明了合理地建模示例有助于识别标签噪声转移矩阵,从而带来更好的分类器,该方法在合成和真实世界的标签噪声数据集上均优于所有最先进的方法。
Sep, 2021
本文针对实例相关标签噪声的学习难题,基于人类认知的分解思想,采用基于部分的标签噪声来近似实例相关标签噪声,通过基于先验的锚点学习过程,结合各部分转移矩阵进行概率近似,得到超越现有方法的实验结果。
Jun, 2020
本文提出了一个基于特征依赖的标签噪声处理算法,该算法采用渐进式标签校正策略,通过理论证明其可以适应广泛的噪声模式并收敛于贝叶斯分类器,实验证明其优于 SOTA 基线算法且对各种噪声类型和程度具有鲁棒性。
Mar, 2021
本文探讨了学习嘈杂标签所需的噪声转移矩阵的可辨识性,并通过 Kruskal 的可辨识性结果表明,对于一般情况下的实例级别的问题,识别噪声转移矩阵需要多个嘈杂标签的支持,此外,我们还展示了标签噪声转移的实例依赖性与统一的认识之间的联系,并提供了实证证据。
Feb, 2022
该研究提出一种二阶方法来处理深度神经网络训练中的标签噪音问题,使用此方法可以解决由任务难度引起的实例相关的噪音,提供一个新的损失函数来处理实例相关噪音,进而能够使用已有的类相关噪音的解决方案来处理该问题。
Dec, 2020
本文研究了在电商商品大数据中存在的噪声标签及其对产品分类模型的影响,提出了一种基于实例依赖噪声的训练解决方案,在多个数据集及噪声方法上进行了实验,结果表明当噪声率不能忽略且数据分布高度倾斜时,分类任务的局限性。
Sep, 2022
本文采用动态分布校准策略来解决与实例相关的标签噪声产生的严重分布偏移问题,提出基于多元高斯分布的平均值和协方差的两种方法来校准偏移后的分布,并在合成标签噪声和真实未知噪声数据集上进行了实验,验证了方法的实用性和有效性。
Oct, 2022
该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架,并使用一个无向图模型来描述干净和嘈杂标签之间的关系,在监督学习过程中学习这个模型。该模型在图像标注问题上应用,并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。
May, 2017
本文通过理论分析探讨了在样本噪声存在的情况下,仅使用噪声样本能否学习到可靠模型的问题。作者认为,没有额外假设条件的情况下,经验风险最小化可以达到最优风险上限。此外,文章还讨论了 0-1 损失的极小极大下限问题,认为纯使用噪声样本无法学习。
Jun, 2023
提出一种基于概率模型的方法来对大规模图像分类数据集中的标签噪声进行建模并进行准确性优化,该方法通过在神经网络分类器的最终隐藏层上放置多变量正态分布的潜在变量来建立噪声的协方差矩阵,并且在多个基准测试数据集上表现出显著提高的准确性。
May, 2021