Zoom-CAM: 从图像标签生成细粒度像素注释
深度学习中越来越需要可解释的 AI。我们的工作旨在将来自较早和较晚网络层的信息结合起来,产生具有竞争力的高分辨率 Class Activation Map,从而准确定位图像特征,从而超越以前的艺术水平。
Apr, 2022
该论文提出了 Gradient-weighted Class Activation Mapping (Grad-CAM) 技术,结合细粒度的可视化方法,通过对 CNN 模型中任意目标概念的梯度进行处理,使得决策更加透明和可解释,同时能够定位各个重要部件,提高模型泛化性。作者通过将 Grad-CAM 应用于图像分类、字幕和视觉问答模型,并通过人机交互实验证明,该技术能够帮助用户建立模型的信任度并成功辨别模型的强弱。
Oct, 2016
该论文提出了一种基于参数化上采样的 Class Activation Mapping 方法,专注于解决卷积神经网络在弱监督条件下物体定位的问题,通过将拟合的解码器与 CNN 分类器相连,利用附加属性如图像统计和大小约束扩展和精细化对象边界,实验证明,与现有的弱监督物体定位方法相比,该方法在保证推理计算效率的同时,在 CAM 定位准确度方面获得了显著的提高。
Sep, 2021
提出了一种基于 Grad-CAM 的透明度技术,通过可视化重要的输入区域来提高人类对卷积神经网络(CNN)模型的理解,帮助理解包括图像字幕和视觉问答(VQA)模型在内的基于 CNN 的模型,并通过测量它们的分类能力、人类可信度和与遮挡地图的相关性来评估它们的视觉解释。
Nov, 2016
本文提出了一种名为 BagCAMs 的插入式机制,使用该机制可以让弱监督目标定位方法(WSOL)的性能得到大幅提高,并在三个 WSOL 基准测试上获得最佳表现。BagCAMs 采用了区域本地化器生成(RLG)策略来定义一组区域本地化器,并从训练有素的分类器中导出它们。
Jul, 2022
本文提出了一种基于连续梯度 CAM 及其非线性多尺度融合 (CG-fusion CAM) 的弱监督语义分割方法,通过重新设计梯度的反向传播方式和非线性激活多尺度融合热图,生成了更精细的类激活图,适合不同大小的损伤区域,实验结果表明所提出的方法的分割性能可与全监督算法相媲美。
Jul, 2023
本文提出了一种新的基于聚类的 CNN 解释算法 Cluster-CAM,它可以分离特征图并采用认知基础映射和认知剪切策略来合并认知图生成显著性热力图,结果显示 Cluster-CAM 比现有的 CAM 能够更准确地匹配人类认知,且在效率和效果上都具有显著优势。
Feb, 2023
本篇论文提出采用无监督学习方法生成的显著图用于像素级注释,在此基础上采用简单而有效的算法训练卷积神经网络,使用图形模型和完全卷积网络为模型更新修复标签歧义和更新粗糙激活地图,结果表明,该算法与目前最佳的强监管方法相当,性能明显优于所有最新的无监督显著性检测方法。
Mar, 2018
提供了一种在未标记数据上进行用户定义粒度层次的语义分割的方法,通过累积全局语义信息并学习映射函数,使得带有粒度调整的语义识别的 Segment Anything Model(SAM)能够用于像素级语义注释,实验结果在 PASCAL VOC 2012 和 COCO-80 数据集上分别比现有最先进方法的 mIoU 提高了 17.95% 和 5.17%。
Dec, 2023