- ECCV促进具噪声标签学习中的适应性与平衡
我们提出了一种名为 SED 的简单而有效的方法,以自适应和类平衡的方式处理标签噪声,通过设计新的样本选择策略来赋予自适应性和类平衡性,利用平均教师模型纠正噪声样本的标签,采用自适应和类平衡的样本重新加权机制为检测到的噪声样本分配不同的权重, - 论 H&E 染色图像中 PHH3 对有丝分裂图像检测的价值
PHH3 辅助标注对细胞分裂器官水平的物体一致性和标注者之间的一致性有显著影响;开发了一种新的双染色细胞分裂器官检测器,通过 H&E 染色与 PHH3 染色图像之间的信息不匹配解释,明显优于单染色检测器。
- ICML利用神经网络进行天气数据清洗
气候科学中,比较不同数据集时常常会遇到不匹配的问题,本研究以热带气旋位置为例研究了数据集不匹配所带来的问题,通过训练神经网络来解决数据集不匹配的问题,并发现神经网络在处理有噪声标签的数据时表现更佳。
- ACL低资源科学自然语言推理的共同训练
我们提出了一种新的协同训练方法,通过根据分类器的训练动态为远程监督标签分配权重,反映了它们在后续训练轮次中的使用方式。我们通过分配重要权重而不是基于预测置信度的任意阈值过滤示例,使得自动标记的数据得以最大化利用,同时确保噪声标签对模型训练的 - 释放开放集嘈杂样本潜力:针对医学图像分类的标签噪声
在医学图像分类方面,为解决闭集和开放集标签噪音的问题,我们提出了一个扩展噪音鲁棒对比和开放集特征增强(ENCOFA)框架,包括扩展噪音鲁棒有监督对比(ENSC)损失和开放集特征增强(OSFeatAug)模块,针对开放集噪音样本的识别和特征提 - 实例分割中标签噪声的基准测试:空间噪声的重要性
通过模拟不同噪声条件,对不同分割任务中实例分割模型的鲁棒性和泛化能力进行了评估,引入了 COCO-N 和 Cityscapes-N 作为强注释噪声的实验场景。同时,提出了利用基础模型和弱标注来模拟半自动标注工具和其噪声标签的 COCO-WA - 领域不可知公平修正的标签噪声鲁棒性:最近邻标签传播
在最后一层重新训练中,我们提出了一种针对标签噪音的快速修正方法,通过在潜在最近邻图上进行标签传播,实现了在广泛数据集上对称标签噪音下最差群体准确性的最先进水平。
- NoisyGL: 图神经网络在标签噪声下的综合基准
本研究提出了第一个面向噪声标签下图神经网络的全面基准 NoisyGL,以允许对噪声标签下图数据上的 GLN 方法进行公平比较和详细分析,并揭示了几个在先前研究中被忽视的重要见解。
- CVPR使用标签噪声学习具有鉴别性动态的噪声标签检测
该论文提出了 DynaCor 框架,通过训练信号的动态来区分正确标记的实例和错误标记的实例,该框架在各种噪声类型和噪声率下显示出超越其他最先进方法的性能和强大的鲁棒性。
- 探索决策树对标签噪声的鲁棒性的损失设计技术
本研究探索了如何利用深度学习中的损失设计思路来提高决策树的鲁棒性,发现传统的损失修正和对称损失方法并不有效,指出需要探索其他方向来改善决策树对标签噪声的鲁棒性。
- 跳跃教学:高效稳健的有噪标签学习
抽样选择、标签噪音、模型更新、选择偏差和语义特征空间是此论文的关键词。该论文提出的方法在各种噪声设置中实现了近 2.53 倍的加速,0.46 倍的峰值内存占用,并具有卓越的鲁棒性。
- NoiseBench: 命名实体识别中真实标签噪声对性能的基准测试
提出了一个包含 6 种真实噪音的 NER 基准,证明真实噪音比模拟噪音更具挑战性,并展示当前最先进的噪音鲁棒学习模型远未达到其理论可达的上限。
- 分布鲁棒性的瞬间
在分布鲁棒学习中,我们引入了基于对抗性矩违规的新的极小极大目标,并展示了通过最小化该目标等效于最小化与真实条件期望的最坏情况下的 $l_2$ 距离,从而在计算成本上提供了大体量的经验性节省。
- 有效且稳健的对抗训练以应对数据和标签损坏
我們提出了一種有效且強健的對抗訓練 (ERAT) 框架,能夠同時處理兩類污染 (即數據和標籤),而不需要事先了解其具體信息。我們通過混合對抗訓練和基於類平衡樣本選擇的半監督學習提高了模型對雙重污染的韌性。大量實驗證明了我們提出的 ERAT - 基于对比的深度嵌入对抗病理图像标签噪声鲁棒性分类
深度学习在医学图像分类方面取得了显著的进展,然而在组织病理学图像分类中,噪声标签表示了一个关键挑战,导致深度学习模型性能严重下降。本研究通过对多个数据集进行彻底的经验分析,展示了基于自监督对比训练方式训练的基础模型所提取出的嵌入向量对标签噪 - 提取清洁平衡的子集以用于嘈杂的长尾分类
使用基于分布匹配的类原型和最优传输的伪标注方法,结合观察标签和伪标签的有效筛选标准,成功解决了长尾分布和标签噪声的联合问题,提供了更加平衡、准确的训练样本集,为具有标签噪声的长尾分类提供了有效的性能提升。
- 标签噪声的协同稀疏恢复
通过引入协同稀疏恢复(CSR)方法,该研究通过协调模型预测与噪声恢复来减小错误泄露,从而提高模型泛化性能和降低验证偏差。CSR + 是一种基于 CSR 的联合样本选择策略的学习框架,在具有更多类别和高比例实例特定噪声的数据集上表现出显著优势 - 分类中的噪音标签处理:一项调查
对于计算机视觉任务尤其是图像分类任务,本综述全面回顾了应对噪声标签的不同深度学习方法的演变,研究了不同的噪声模式,并提出了一种由现实世界数据引导的算法来生成合成标签噪声模式,以形成一个新的以真实世界数据为指导的合成基准,并在该基准上评估了一 - CVPR房间里的喧嚣大象:你的离群检测器对标签噪声是否鲁棒?
通过对 20 种最先进的 OOD 检测方法进行大量实验,我们发现类标签噪声对 OOD 检测有重要影响,现有方法中错误分类的 ID 样本与 OOD 样本之间的差异较小是一个被忽视的限制。
- FedFixer:减轻联邦学习中的异构标签噪声
Federated Learning heavily relies on label quality, but noisy and heterogeneous label distribution poses challenges; Fed