- 双增强变换器网络用于弱监督语义分割
通过使用双增强变换网络和自正则化约束,为弱监督语义分割(WSSS)问题提供一种有效的解决方法,该方法通过将 CNN 和 Transformer 网络相结合进行相互补充学习,并在最终输出上进行增强来改善分割效果。在具有挑战性的 PASCAL - 知识图谱推理的弱监督语义分割
这篇论文介绍了一种基于图推理的方法来提高弱监督语义分割技术,该方法同时增强了多标签分类和分割网络阶段,并融合了外部知识和图卷积网络来全局推理跨类别依赖关系,以改善生成伪标签的完整性,并应用图推理映射模块加强高级语义的特征表示,动态学习个别样 - 背景激活抑制用于弱监督物体定位和语义分割
使用仅有图像级标签的弱监督对象定位和语义分割方法,该论文引入了一个前景预测图(FPM)的新范例,通过生成 FPM 实现像素级定位;通过观察发现,随着前景掩模的扩大,交叉熵收敛为零(当前景仅覆盖对象部分时),激活值持续增加(直至前景掩模扩展到 - BroadCAM: 面向小规模弱监督应用的结果无关类激活映射
我们提出了一种面向小规模弱监督应用的结果无关 CAM 方法,叫做 BroadCAM,通过在各种 CNN 架构中对 VOC2012(自然图像)和 BCSS-WSSS(医学图像)进行评估,在小规模数据(不到 5%)中表现出比现有 CAM 方法更 - 超越判别区域:作为 CAM 替代品的显著性图用于弱监督语义分割
近年来,提出了几种使用分类器生成的类激活图(CAMs)产生伪地面实况用于训练分割模型的弱监督语义分割(WS3)方法。本文对 WS3 中的类激活图(CAMs)和显著图进行了全面比较,并提出了新的评估指标,以全面评估 WS3 中替代方法的性能。 - ICCV弱监督语义分割的全对一一致性学习
通过提出新的基于 Transformer 的正则化方法,我们改进了弱监督语义分割(WSSS)中的目标定位问题。我们引入了一种全对一的一致性正则化方法,以保持不同图像增强之间的激活强度不变,并确保在每个 CAM 中的区域之间的关联保持一致。此 - MCTformer+: 弱监督语义分割的多类标记变换器
本文提出了一种新颖的基于 Transformer 的框架,旨在通过生成准确的类特定目标定位图作为伪标签来增强弱监督语义分割,并探讨了 Transformer 模型捕捉类特定关注力以实现具有类鉴别性的目标定位的潜力。
- 提示类别探讨弱监督语义分割中的提示类别学习的力量
本文介绍了一种新的 PrOmpt cLass lEarning (POLE) 策略,在弱监督语义分割(WSSS)问题上实现最先进的性能,并强调了语言 - 视觉模型在 WSSS 中的优势和提示学习在该问题中的潜力。
- 弱监督医学图像分割的条件扩散模型
本研究利用条件性传播模型中的类别信息来获取仅基于图像级注释的目标对象预测掩码,并且超越了先前的方法在两个公共医学图像分割数据集上的表现。
- P-NOC: 弱监督语义分割的对抗性 CAM 生成
本研究提出了一种基于类别的对抗擦除策略,在弱监督语义分割中实现模型的正则化和提高模型性能。经实验证明,该策略可以在 Pascal VOC 2012 和 MS COCO 2014 数据集上显著提高模型的语义分割效果。
- 弱监督语义分割的遮盖式协同对比
本文介绍了一种有效的方法 Masked Collaborative Contrast(MCC),以突出弱监督语义分割中的语义区域。MCC 巧妙地将掩蔽图像建模和对比学习的概念结合起来,设计了可诱导关键字收缩到语义相关区域的 Transfor - 基于多尺度注意融合的自训练框架用于弱监督语义分割
提出一种利用多尺度类别感知度量融合的自训练方法,采集不同尺度的注意力图信息并应用去噪和激活策略来增强潜在区域和减少嘈杂区域,最后利用优化后的注意力图重新训练模型,实验证明该方法可以从多尺度图像提取丰富的语义信息,并在 PASCAL VOC - 基于 SAM 模型的弱监督语义分割增强伪标签
使用 Segment Anything Model(SAM)结合 Class Activation Maps(CAM)生成更高质量的伪标签,用伪标签为特定类提供信号,选择相关的 mask 并用它们进行标注以产生一个更精确的伪标签,综合我们的 - Transformer 中减少弱监督语义分割中的过度平滑现象
本文从亲和矩阵的连续性及其导致的平滑化现象,以及增强的注意力矩阵在深层的噪音问题入手,提出了一种新的自适应反激活机制(AReAM),该机制通过通过对亲和矩阵的局部和全局关注,可有效减少无关的背景噪声,从而提升弱监督语义分割的性能。
- CLIP 也是高效分割器:一种文本驱动的弱监督语义分割方法
利用 Contrastive Language-Image Pre-training (简称 CLIP) 模型进行图像级标注的弱监督语义分割 (WSSS) 是一项具有挑战性的任务。本文提出了一种 CLIP-ES 框架,结合了 softmax - CVPR弱监督语义分割的候选区域修正
本文提出了一种基于分组排名的 Out-of-Candidate Rectification (OCR) 机制,并将其与多个基线模型结合使用,可以在 Pascal VOC 和 MS COCO 数据集上实现显着的性能提升。
- ECCV基于视觉 Transformer 的最大池化方法调和弱监督下的语义分割中的类别和形状
该论文提出了一种新的基于 Vision Transformers (ViT) 的弱监督语义分割方法,命名为 ViT-PCM,该方法不使用传统的 CNN-CAM。在数据集 PascalVOC2012 上实验结果表明,该方法在参数数量最少的情况 - 利用形状线索进行弱监督语义分割
本研究提出了一种基于形状信息的弱监督语义分割方法,采用了新颖的改进方法去增强模型可靠性,能够在单阶段框架内迅速高效地完成训练与推理,在 PASCAL VOC 2012 数据集上的准确率超过了现有的同类方法。
- MM基于显著性引导的弱监督语义分割中的类间、类内关系约束
本文提出了基于显著性引导的跨类和内部类约束模型 (I$^2$CRC),以辅助 CAMs 中的激活对象区域的扩张,在 PASCAL VOC 2012 和 COCO 数据集上进行的广泛实验表明,I$^2$CRC 在众多最先进的方法中具有显著的优 - CVPRL2G: 一个简单的局部到全局的知识迁移框架,用于弱监督语义分割
本文提出了以 L2G 为核心的方法,通过本地分类网络从输入图像中随机获取多个局部路径进行注意提取,然后利用全局网络在线学习多个局部注意映射之间的互补关系,从全局视角学习对象的详细知识,从而产生高质量的注意地图,并将其直接用作语义分割网络的伪