- 耦合混淆纠正:从带有稀疏注释的众包中学习
采用耦合混淆校正的方法对众包注释进行学习,通过双层优化,使模型能够更好地校正系统学习到的混淆矩阵,同时根据注释者群体的相似性进行聚类,从而更好地捕捉注释者的专业知识,特别是对于很少提供标签的注释者。此外,使用 Beta 分布来生成众包注释, - AAAI应对标签噪声的重新分组中值损失
RML 是一种用于降低选择噪声样本概率和校正噪声样本损失的方法,通过稳定的均值损失和健壮的中值损失组合以获得噪声样本的鲁棒损失估计,并提出了新的样本选择策略和基于 RML 的半监督方法来进一步提高模型对标签噪声的性能。
- 基于教师 - 学生框架的实例依赖噪声伪标签校正
通过基于新的师生网络架构 P-LC(伪标签校正)的方法,重新分配每个图像的标签,实现了对复杂噪声环境下深度学习模型的改进和性能提升,并引入噪声水平估计来评估模型性能和指导数据清洗流程。
- CSGNN:通过动态类别选择征服嘈杂节点标签
该研究论文提出了一种名为 CSGNN 的图神经网络方法,通过使用邻居聚合的潜在空间自适应选择可靠的节点,并解决了过拟合、标签噪声、类别选择和干净节点的学习问题。实验证明,CSGNN 在效果和鲁棒性上优于现有方法。
- 基于不确定性感知的远程监督命名实体识别中的教师学习和学生协同学习
提出了一种减轻标签噪声的 Distantly-Supervised Named Entity Recognition 方法,其中包括 Uncertainty-aware Teacher Learning 和 Student-student - ImageNet 模型错误的自动分类
自动化错误分类框架的综合评估表明,尽管 top-1 准确率未能完全衡量模型的真实性能,但仍然是一个有价值的性能指标,对错误类型的占比具有强大的预测能力。
- 使用 PGM 来对抗图神经网络中的标签噪声
本文提出了一种基于概率图模型的框架 LNP,用于处理标签噪音问题,并在不同噪音类型和比例以及异质图形上展现了其鲁棒性能。
- 标签噪声随机梯度下降的泛化界
我们在非凸设置下,使用均匀耗散和平滑条件对带有标签噪声的随机梯度下降(SGD)进行了泛化误差界限的研究。在合适的半度量选择下,我们建立了依赖于参数维度 $d$ 的标签噪声随机梯度流的 Wasserstein 距离压缩。利用算法稳定性框架,我 - 多标注者数据集的损失建模
通过多任务学习和基于损失的标签修正,我们提出了一种学习多样化意见更准确表达的方法,并展示了该方法在单个或多个注释者注释情况下改善预测性能的能力,同时对主观数据应用的附加标签噪音也表现出鲁棒性。
- 基于强盗驱动的批次选择以应对标签噪声下的鲁棒学习
我们引入了一种新颖的方法来选择随机梯度下降(SGD)训练中的批量,利用组合赌博算法。我们的方法主要关注在现实世界数据集中普遍存在的标签噪声的学习过程优化。对 CIFAR-10 数据集的实验评估表明,我们的方法在各种标签污染程度下始终优于现有 - 图形标签噪声的标签传播
本文研究任意异质性情况下的图标签噪声问题,提出了一个简单而高效的算法 LP4GLN,通过迭代步骤恢复图的同质性、修正噪声标签,并选择高可信度标签进行下一次迭代,最终在节点分类任务中取得高准确率。
- 聚合实现的标签差分隐私保护
本研究首次证明了在回归任务中,使用加权聚合方法(不需要或只需很小的附加噪声)可实现标签差分隐私(label-DP)。
- 使用一般替代模型对样本选择进行抵抗标签噪声
利用视觉 - 语言替代模型 CLIP 自动过滤噪声样本,并设计了一种适应性边界损失来规范由 CLIP 引入的选择偏差,从而提供对标签噪声的鲁棒性。在真实和合成噪声数据集上验证了我们提出的方法的有效性。
- CAPro: 跨模态对齐原型的网络监督学习
本论文提出了一种名为 CAPro 的统一原型对比学习框架,它利用文本原型和视觉特征空间来解决 web 图像学习中的标签噪声问题,并取得了显著的性能提升。
- 质量感知联邦学习中的稳定性价格
通过建模客户间的交互为一个标签去噪游戏,本研究表明均衡结果总是导致全局模型准确性降低于社会最优解,并进一步设计了一个高效的算法来计算社会最优解。
- 为何敏锐度感知最小化的泛化能力优于 SGD?
训练大型神经网络时,过拟合的挑战变得日益重要。为解决这一问题,Sharpness-Aware Minimization(SAM)作为一种有希望的训练方法出现,可在存在标签噪声的情况下提高神经网络的泛化性能。然而,对于非线性神经网络和分类任务 - Pi-DUAL:利用特权信息区分干净和嘈杂标签
Pi-DUAL 是一种利用特权信息来减轻标签噪声的简单、可扩展和实用的方法,通过将输出的逻辑分解为基于传统输入特征的预测项和仅受特权信息影响的噪声适配项,Pi-DUAL 能够自适应地在这两个项之间切换焦点,从而使模型隐性地区分干净标签和错误 - 鲁棒 - GBDT: 一种新的梯度提升模型用于噪声鲁棒分类
该研究介绍了一种名为 Robust-GBDT 的噪声鲁棒增强模型,该模型在多类分类任务中应用广泛,通过采用凸可靠损失函数和处理类不平衡的新型鲁棒损失函数,有效抵抗标签噪声和类别不平衡,提高了分类准确性和泛化能力。
- 理解和降低预训练中的标签噪声对下游任务的影响
通过大规模数据集的预训练和下游任务的微调已经成为深度学习中的标准实践。然而,预训练数据通常包含可能对模型的泛化产生不利影响的标签噪声。本文旨在理解预训练数据中噪声的特性,并减轻其对下游任务的影响。我们通过对合成噪声的 ImageNet-1K - 通过方差抑制增强对锐度感知优化
通过利用损失函数的几何特性,尤其是最小值邻域的平坦特性,锐度感知最小化(SAM)提高了深度神经网络的泛化能力,而无需大规模增强数据。本文的创新方法通过方差抑制(VaSSO)稳定了对手,并证明了在模型无关任务中,包括图像分类和机器翻译中,Va