ICCVOct, 2016

Grad-CAM: 基于梯度的定位,通过深度网络提供视觉解释

TL;DR该论文提出了 Gradient-weighted Class Activation Mapping (Grad-CAM) 技术,结合细粒度的可视化方法,通过对 CNN 模型中任意目标概念的梯度进行处理,使得决策更加透明和可解释,同时能够定位各个重要部件,提高模型泛化性。作者通过将 Grad-CAM 应用于图像分类、字幕和视觉问答模型,并通过人机交互实验证明,该技术能够帮助用户建立模型的信任度并成功辨别模型的强弱。