- AAAI精确至关重要:精确感知的弱监督语义分割集成
ORANDNet 是一种针对弱监督语义分割的新型集成方法,利用两个不同分类器的类激活图和课程学习,提高了伪掩模的精确性并减轻了噪声,从而显著提高了分割性能。基于此方法的扩展同样适用于其他高级弱监督语义分割模型,表明 ORANDNet 具有作 - 点监督核分割中的动态伪标签优化
通过使用类别激活图 (CAMs) 适应地捕捉与标注点具有相似语义的区域,在深度学习中实现准确的核分割,从而克服了基于点标注方法中产生伪掩模的问题。
- CAPE: 用于增强深度神经网络解释的概率集成 CAM
本文提出了一种名为 CAPE 的新型 CAM 方法,通过对图像区域的统一概率评估来改善 DNN 解释性,在 CUB 和 ImageNet 等数据集上与最先进的 CAM 方法进行了量化和定性比较,并在描绘具有挑战性的 CMML 诊断问题的细胞 - 量化对神经网络感知的影响:量化如何改变视觉模型的感知领域?
本研究探讨了量化对视觉模型的感知领域特征,尤其是类别激活图(CAMs)的影响,并通过对六种不同 CNN 模型进行系统的量化技术评估,揭示了 CAMs 与人类视觉显著性图之间的对齐问题和不同模型对量化的敏感性,为实际应用中的模型性能和可解释性 - 语义分割的交换分配弱监督共训练
提出了一种采用引导类激活图的端到端弱监督语义分割模型 CoSA,通过交替学习和三种技术的引入,有效减少了类激活图的不一致性和错误,达到了优于现有方法的性能。
- CoBra: 强大的弱监督语义分割的补充分支结合类别和语义知识
在这项工作中,我们提出了一种新的双分支框架 ——CoBra,它由两种不同的架构组成,为每个分支提供有价值的类别(来自 CNN)和语义(来自 ViT)的互补知识,以显式融合它们的补充知识,并促进一种新型的额外模块级监督。通过 CoBra,我们 - 利用 Swin Transformer 进行局部到全局弱监督语义分割
近年来,计算机视觉领域中的弱监督语义分割使用基于图像级标签的监督引起了广泛关注。本研究探索了使用 Swin Transformer 的 'SWTformer' 来提高初始种子 CAMs 的准确性,通过结合局部和全局视角。
- 可视化解释性的类激活图综述
最近在深度学习方法学研究方面取得了一系列复杂的计算机视觉模型技术,达到甚至超过了人类的表现。然而,这些黑盒深度学习模型在可解释性和透明度方面存在一定限制,而这对将学习机器纳入涉及人类监督的敏感决策支持系统中是至关重要的。因此,解释性计算机视 - 重新思考用于分割的类激活图:通过降噪展示浅层语义信息
我们提出了一个基于梯度的简单去噪方法,用于过滤噪声并生成高质量的类激活图,通过大量实验验证了该方法在弱监督语义分割任务中的有效性。
- MetaCAM:基于集成的类激活图
提出了基于集成的 MetaCAM 方法,结合多种现有的 Class Activation Maps 方法,通过对组件 CAMs 中最高激活像素的前 k% 的一致性进行集成,优化了深度学习模型预测中显著区域的定位性能,并通过自适应阈值方法改善 - 聚合类别激活图的可视化分析全局类特征的方法
使用 Class Activation Maps(CAMs)方法对深度学习模型进行全局解释,通过方块表示每个特征的分类影响,大小描述了不同样本间影响的变化,提供交互式直方图进行进一步分析筛选,从而在高维数据中检测重要特征并根据全局解释进行 - 基于 SAM 模型的弱监督语义分割增强伪标签
使用 Segment Anything Model(SAM)结合 Class Activation Maps(CAM)生成更高质量的伪标签,用伪标签为特定类提供信号,选择相关的 mask 并用它们进行标注以产生一个更精确的伪标签,综合我们的 - CVPR基于类别注意力转移的知识蒸馏
提出了一种基于类别注意力传递的知识蒸馏(CAT-KD)方法,该方法不仅具有高解释性,还在多个基准测试中实现了最先进的性能,通过传输课程激活地图,从而提供了关于 CNN 的更好的理解,并改进了 CAT-KD 的解释性。
- 增强弱监督分割的高保真伪标签
该论文提出了一种基于图片分类网络和概率解释 CAM 的图像级弱监督语义分割方法来改善先前弱监督下模型的性能,通过提高区域相似性和轮廓质量来增强几乎任何以前的 WSSS 方法,并在 PASCAL VOC 数据集上进行了演示。
- CVPR从非判别特征中提取类激活图
提出了一种新的计算 CAM 的方法,通过引入一种新的计算方法,可以显式地捕捉到不具有识别能力的对象特征,从而将 CAM 扩展到覆盖整个对象,实验结果表明,该方法在弱监督语义分割领域具有优越性,且计算成本较低。
- ECCV使用注意力机制学习基于 DCNN 的图像分类器的视觉解释
本文提出了两种新的基于学习的 eXplainable AI(XAI)方法,用于深度卷积神经网络(DCNN)图像分类器,称为 L-CAM-Fm 和 L-CAM-Img,通过插入在原始(冻结的)DCNN 中的注意机制,并被训练为从最后一个卷积层 - MM基于显著性引导的弱监督语义分割中的类间、类内关系约束
本文提出了基于显著性引导的跨类和内部类约束模型 (I$^2$CRC),以辅助 CAMs 中的激活对象区域的扩张,在 PASCAL VOC 2012 和 COCO 数据集上进行的广泛实验表明,I$^2$CRC 在众多最先进的方法中具有显著的优 - CVPRL2G: 一个简单的局部到全局的知识迁移框架,用于弱监督语义分割
本文提出了以 L2G 为核心的方法,通过本地分类网络从输入图像中随机获取多个局部路径进行注意提取,然后利用全局网络在线学习多个局部注意映射之间的互补关系,从全局视角学习对象的详细知识,从而产生高质量的注意地图,并将其直接用作语义分割网络的伪 - CVPR弱监督语义分割的类别激活图
本文介绍了一种称为 ReCAM 的弱监督语义分割方法,通过将 softmax 交叉熵损失函数用于已收敛的 class activation map 从而生成高质量的掩膜。
- ICCVCAM-loss: 学习空间区分特征表示
提出了一种新型的 CNN 分类器损失函数,即 CAM-loss,利用类激活映射来约束特征图,以得到更具有区分度的特征表示,并提出了一种基于 CAAM-CAM 匹配的知识蒸馏方法。