Zoom-CAM: 从图像标签生成细粒度像素注释

Oct, 2020

Zoom-CAM: 从图像标签生成细粒度像素注释

Zoom-CAM: Generating Fine-grained Pixel Annotations from Image Labels

Xiangwei Shi, Seyran Khademi, Yunqiang Li, Jan van Gemert

TL;DR本文提出一种新的基于类别感知可视化技术的异类弱监督学习方法 Zoom-CAM，可以将来自各个卷积层的信息结合起来以生成高质量的伪标签，提高目标定位和分割的精度。

Abstract

Current weakly supervised object localization and segmentation rely on class-discriminative visualization techniques to generate pseudo-labels for →

weakly supervised object localization pseudo-labels class activation mapping zoom-cam pixel-level training

发现论文，激发创造

多通道高分辨率卷积神经网络类激活图

深度学习中越来越需要可解释的 AI。我们的工作旨在将来自较早和较晚网络层的信息结合起来，产生具有竞争力的高分辨率 Class Activation Map，从而准确定位图像特征，从而超越以前的艺术水平。

Apr, 2022

Grad-CAM: 基于梯度的定位，通过深度网络提供视觉解释

该论文提出了 Gradient-weighted Class Activation Mapping (Grad-CAM) 技术，结合细粒度的可视化方法，通过对 CNN 模型中任意目标概念的梯度进行处理，使得决策更加透明和可解释，同时能够定位各个重要部件，提高模型泛化性。作者通过将 Grad-CAM 应用于图像分类、字幕和视觉问答模型，并通过人机交互实验证明，该技术能够帮助用户建立模型的信任度并成功辨别模型的强弱。

Oct, 2016

F-CAM: 通过引导参数上采样生成完整分辨率的类激活地图

该论文提出了一种基于参数化上采样的 Class Activation Mapping 方法，专注于解决卷积神经网络在弱监督条件下物体定位的问题，通过将拟合的解码器与 CNN 分类器相连，利用附加属性如图像统计和大小约束扩展和精细化对象边界，实验证明，与现有的弱监督物体定位方法相比，该方法在保证推理计算效率的同时，在 CAM 定位准确度方面获得了显著的提高。

Sep, 2021

Grad-CAM：你为什么这样说？

提出了一种基于 Grad-CAM 的透明度技术，通过可视化重要的输入区域来提高人类对卷积神经网络（CNN）模型的理解，帮助理解包括图像字幕和视觉问答（VQA）模型在内的基于 CNN 的模型，并通过测量它们的分类能力、人类可信度和与遮挡地图的相关性来评估它们的视觉解释。

Nov, 2016

基于区域分类激活图的弱监督目标定位袋装技术

本文提出了一种名为 BagCAMs 的插入式机制，使用该机制可以让弱监督目标定位方法（WSOL）的性能得到大幅提高，并在三个 WSOL 基准测试上获得最佳表现。BagCAMs 采用了区域本地化器生成（RLG）策略来定义一组区域本地化器，并从训练有素的分类器中导出它们。

Jul, 2022

CG-fusion CAM: 大孔径光学元件激光损伤在线分割

本文提出了一种基于连续梯度 CAM 及其非线性多尺度融合 (CG-fusion CAM) 的弱监督语义分割方法，通过重新设计梯度的反向传播方式和非线性激活多尺度融合热图，生成了更精细的类激活图，适合不同大小的损伤区域，实验结果表明所提出的方法的分割性能可与全监督算法相媲美。

Jul, 2023

基于图像级标签的粗到细语义分割

该研究提出了一种基于图像类别标签的新型递归粗到细语义分割框架，可用于图像分割和前景分割等任务，并且只需要一个标签来处理包含多类别对象的图像。

Dec, 2018

Cluster-CAM: 基于聚类加权的 CNN 图像分类决策可视化

本文提出了一种新的基于聚类的 CNN 解释算法 Cluster-CAM，它可以分离特征图并采用认知基础映射和认知剪切策略来合并认知图生成显著性热力图，结果显示 Cluster-CAM 比现有的 CAM 能够更准确地匹配人类认知，且在效率和效果上都具有显著优势。

Feb, 2023

利用图像标签进行弱监督显著目标检测

本篇论文提出采用无监督学习方法生成的显著图用于像素级注释，在此基础上采用简单而有效的算法训练卷积神经网络，使用图形模型和完全卷积网络为模型更新修复标签歧义和更新粗糙激活地图，结果表明，该算法与目前最佳的强监管方法相当，性能明显优于所有最新的无监督显著性检测方法。

Mar, 2018

面向粒度调整的像素级语义标注

提供了一种在未标记数据上进行用户定义粒度层次的语义分割的方法，通过累积全局语义信息并学习映射函数，使得带有粒度调整的语义识别的 Segment Anything Model（SAM）能够用于像素级语义注释，实验结果在 PASCAL VOC 2012 和 COCO-80 数据集上分别比现有最先进方法的 mIoU 提高了 17.95% 和 5.17%。

Dec, 2023