- CVPR不要丢弃你的样本!有意识的连贯训练有助于条件扩散
本文提出了一种新的方法,名为一致性感知扩散(CAD),通过将一致性信息引入扩散模型,使其能够从带有噪声标注的数据中学习,而无需摒弃数据。该方法在各种条件生成任务上在理论上和实证上表现出很好的性能,能够生成符合条件信息的真实且多样化的样本。
- 关于文本生成中上下文学习的噪声鲁棒性
大型语言模型在文本生成任务中,噪声标注显著影响了上下文学习的性能,因此我们提出了一种名为本地困惑度排序(LPR)的简单有效方法,通过在语义空间中对邻居进行排序,以防止选择到不匹配的输入 - 标签对,同时保持原始选择方法的有效性。大量实验证明 - 具有注释错误修正的尺度感知人群计数网络
提出了一种 “尺度感知” 人群计数网络 (SACC-Net),通过引入具有纠正噪声注释能力的空间变化高斯分布来同时建模标签错误和尺度变化,从而生成细粒度的人群密度热力图,进而实现优越的人群计数准确性。
- 降低标注成本的实证研究:对弱、噪音和 SAM 生成的标注在分割网络训练中的应用
通过对 11 种注释策略和 4 个数据集进行彻底的成本效益评估,我们得出结论:当注释时间有限时,准确地勾绘感兴趣的对象通常不是最佳方法,注释时间越多也是如此。在这种情况下,突出显示的注释方法是(1)具有少量顶点的基于多边形的注释,以及(2) - 鲁棒协同学习的实用边缘检测
通过开发基于协作学习的模型 PEdger,我们试图解决边缘检测中的深度学习模型计算成本大、模型尺寸大、噪声标注和不准确性等问题,并通过大量实验证明了其在准确性、速度和模型尺寸方面的优越性。
- 适应性阈值和负类引导嘈杂标注的鲁棒性面部表情识别
本研究提出了一种动态自适应阈值的方法来解决面部表情识别中存在的不准确注释的问题,该方法通过样本选择和负类一致性引导模型学习,以获得比现有基线方法更好的性能。
- 基于联合似然密度图和合成融合金字塔网络的尺度感知人群计数
本文开发一种 Synthetic Fusion Pyramid Network(SPF-Net)和设计具有尺度感知损失函数,以实现准确的人群计数。我们以 Gaussian 模型噪声标注点,从输入图像中导出人群概率密度图。然后,我们使用多尺度 - 基于动态自适应阈值学习的鲁棒性面部表情识别
通过动态阈值方法,从含无干扰样本的数据集中选择数据,以减少嘈杂注释对面部表情识别深度学习的影响。同时,该研究还构建了一个无监督的同步 loss 机制使其能够学习从所有的数据集中学习。
- CVPR面向嘈杂标注下的鲁棒自适应目标检测
本研究提出一种面向带有噪声注释的领域自适应目标检测(DAOD)的框架,包括潜在实例挖掘、可变形图关系模块和熵感知梯度协调等关键技术,将语义信息纳入学习过程,取得了不错的实验成果。
- 目标检测中的嘈杂标注精炼
本研究提出了一种新的方法来在包含类标注和边界框注释的噪声数据集上训练目标检测器,能高效地分离这些噪音并进行纠正,使训练得到的检测器能够显著优于基准检测器。
- CVPR基于自适应早期学习校正的带噪声标注分割技术
本文研究了在存在噪声标注的情况下深度学习在分割任务中的学习动态,并发现网络在学习之初会优先适应清晰的像素级别标签,然后才会记忆错误的标注。针对这一现象,本文提出一种新的从噪声标注中进行分割的方法,利用两个关键元素:单独检测每个类别的记忆化阶 - 元学习中的软标签学习
提出了一种利用可学习标签和动态正则化来解决固定标签产生的过拟合、泛化性能下降等问题的框架方法,并应用于数据集噪声过大的情况中取得了显著的改进。
- 医学图像分割中区分人类错误和基本事实
本文提出了一种使用两个耦合的 CNN 从纯噪声观察中联合学习单个标注者的可靠性和真实分割标签分布的方法,该方法在三个公共医学影像分割数据集上表现良好,尤其是在注释数量较少且出现较大不一致性的情况下。
- 早期学习规范化防止对噪声标签的记忆化
提出了一种基于早期学习的新型噪声分类技术框架,使用半监督学习的目标概率和正则化项,防止深层神经网络过于依赖错误标注而导致的过拟合现象。测试结果表明,该方法在多个标准基准数据集和实际数据集上均能达到与现有先进技术可比的鲁棒性。
- 面向具有噪声标注的抗噪声目标检测
本文提出了一种训练目标检测器的框架,该框架可以处理含有混合标签噪声和边界框噪声的嘈杂标注数据,并通过交替噪声校正和模型训练来共同优化目标标签、边界框坐标和模型参数,其方法通过执行两个步骤来分离标签噪声和边界框噪声,并在 PASCAL VOC - ECCV同时边缘对齐和学习
本文提出一个同时进行边缘对齐和学习的概率模型,以解决全卷积神经网络 (FCNs) 边缘学习结构脆弱容易受到标签不对齐的影响的问题,并为噪声注释提供了自动改进机制,改善了边缘检测。
- CVPR在最小监督下从嘈杂大规模数据集中学习
本文介绍了一种使用大型包含嘈杂注释图像和少量清洁注释图像联合进行学习的方法,它由一个多任务网络组成,可以在清洁注释的帮助下减少大型数据集中的噪音,并在清洁数据集和带有降噪的完整数据集上进行微调学习,其结果比直接微调方法在 Open Imag