- 医学预测问题中的有噪标签深度学习:一项范围审查
通过对深度学习的医学预测问题中的标签噪声管理进行全面审查,包括标签噪声检测、标签噪声处理和评估,本文提供了一系列实用问题的研究结果,其中包括标签噪声的来源、影响、检测、处理技术以及它们的评估,还提供了标签噪声检测方法和处理技术的分类。
- 基于骨骼的带有噪声标签的人体动作识别
理解人体姿势的行为对于与人类共享空间的辅助机器人来说是至关重要的,为了能够对下一次交互做出明智和安全的决策。然而,准确的时间定位和标注活动序列是耗时的,而且结果往往带有噪声。本研究通过将骨架动作识别方法与来自多个研究领域的标签去噪策略相结合 - 学习带有噪音基础模型
该论文通过广泛的实验证明,虽然在预训练中存在一定的噪声可以提高域内性能,但它总是破坏域外性能,然后提出了一种调整方法来减轻噪声的不良影响并提高泛化能力。
- 自信的先验是否可以取代冷漠的后验?
图像分类中使用的基准数据集往往具有非常低的标签噪声。当贝叶斯神经网络在这些数据集上进行训练时,它们往往会欠拟合,错误地表示数据的不确定性。一种常见的解决方法是通过冷却后验,这提高了对训练数据的拟合,但从贝叶斯的角度来解释具有挑战性。我们探讨 - 探讨视觉变换器在医学图像分类中对标签噪声的稳健性
医学图像分类数据集中的标签噪声严重影响了受监督深度学习方法的训练,削弱了其泛化能力。本文研究了 Vision Transformer (ViT) 相对于 CNN 的鲁棒性,以及其处理医学图像分类中标签噪声的能力,并使用两个医学图像分类数据集 - 重新审视远程监督的命名实体识别:一个新的基准和一种简单方法
该研究论文探讨了在遥感监督(DS-NER)框架下的命名实体识别(NER),其中主要挑战在于由于伪阳性、伪阴性和正类型错误等固有错误导致标签质量受损。我们批判性评估了当前 DS-NER 方法的效力,使用了一个名为 QTL 的真实基准数据集,揭 - 多类别标签噪声下的自我蒸馏和部分标签学习的理解
自蒸馏是使用教师模型的输出来训练学生模型的过程,本研究在多类别分类中从理论上探讨了自蒸馏,研究了多轮自蒸馏和使用精炼教师输出的自蒸馏,其灵感源于部分标签学习(PLL)。我们通过为学生模型的输出推导出一个封闭形式解,发现自蒸馏在具有高特征相关 - 当联合学习遇到噪声标签时,重审早期学习正则化
FLR 是一种创新策略,通过生成新的伪标签并将本地和全局模型的预测相结合,有效地应对联邦学习中的标签噪声问题,提高全局模型在不同设置下的准确性并防止记忆嘈杂的标签,从而改善在标签准确性有误的 FL 环境中的泛化能力。
- 学习时间序列的时间标签噪声
多个连续分类任务受到随时间变化的标签噪声的影响。我们首次提出并规范了时间标签噪声问题,该问题在时间序列连续分类中尚未被研究。在这个设置中,多个标签按顺序记录,同时被一个时间相关的噪声函数所污染。我们首先证明了建模标签噪声函数的时间特性的重要 - 具有风险剩余的鲁棒多任务学习
使用多任务学习的方法,通过考虑过度风险的任务平衡,来解决存在标签噪音的情况下,优化问题中任务权重难以调整的挑战。
- 非可分解性能度量上的多类别带噪标签学习
从含有噪声标签的数据中学习良好分类器一直备受关注,我们的研究旨在设计算法,以应对多类非可分解性能度量的噪声标签,并通过实验证实了算法在处理标签噪声方面的有效性。
- 随机分摊:加速特征和数据归因的统一方法
该研究论文通过训练具有噪声标签的模型,通过理论分析和实验研究,证明了这种方法在特征归因和数据估值等任务中能够显著加速,并且通常比现有方法快一个数量级。
- 理解领域泛化:噪声稳健性视角
机器学习算法中的领域泛化与经验风险最小化的效果在标准基准测试中没有明确的经验证据,但是通过标签噪声的研究可知,领域泛化算法在有限样本训练中具有隐含的标签噪声鲁棒性,在合成实验中可以缓解虚假相关性并提高泛化性能,但在真实世界的基准数据集上的综 - 学习从噪声标注中检测遥感图像中的云和雪
通过构建新的数据集、提出新的训练策略以及设计更适用的模型性能评估方法,本文首次考虑标签噪声对遥感图像中云和雪的检测的影响,并验证了所提出方法的有效性。
- 可靠的测试时间适应性的解耦原型学习
通过提出 Decoupled Prototype Learning (DPL) 方法,本研究解决了使用伪标签进行交叉熵损失微调时容易受到标签噪声影响的问题,并引入了基于内存的策略增强小批量处理的鲁棒性,在遇到不确定伪标签的样本时,使用一致性 - 医学图像分析中的噪声学习中,带有噪声率估计的样本选择
本文介绍一种新的噪声鲁棒学习方法,将噪声率估计整合到样本选择方法中,以处理有噪声的数据集,首先根据损失值的分布使用线性回归估计数据集的噪声率,然后根据估计的噪声率排除可能有噪声的样本,并进一步使用稀疏正则化来提高我们的深度学习模型的鲁棒性, - AAAI通过负蒸馏实现具有极度噪声客户端的联邦学习
通过负抽取方法,利用带有噪声数据的客户端训练模型,并在知识蒸馏中使用伪标签提高模型的可信度,通过负抽取的模型聚合方法提高联邦学习系统的性能。
- 使用局部极大似然估计的条件类别噪声的假设检验
在监督学习中,评估标签质量成为一个尚未解决的研究问题。本文提出了一种替代路径,使用非参数逻辑回归模型构建基于污染标签噪声的假设检验,相比传统的参数方法具有更强的适应性和较少的模型设定问题。
- ERASE:图上的容错错误鲁棒表示学习
通过最大化编码率减少,ERASE 方法通过在图中学习具有容错性的表示来增强深度学习模型对于标签噪声的鲁棒性,结合原型伪标签与传播去噪标签更新表示,并通过预纠正噪声标签以及处理有噪声图数据来显著提高节点分类的泛化性能。
- 耦合混淆纠正:从带有稀疏注释的众包中学习
采用耦合混淆校正的方法对众包注释进行学习,通过双层优化,使模型能够更好地校正系统学习到的混淆矩阵,同时根据注释者群体的相似性进行聚类,从而更好地捕捉注释者的专业知识,特别是对于很少提供标签的注释者。此外,使用 Beta 分布来生成众包注释,