Feb, 2018

深度卷积网络的影响驱动解释

TL;DR该研究旨在解释深度神经网络的行为特性,作者通过使用基于公理的影响测量方法来识别对感兴趣的数量和分布具有高影响力的神经元,并解释这些神经元所代表的概念。通过在 ImageNet 数据集上测试,作者证明了影响导向的解释方法具有将信仰术语的影响概念推广到更多实例的能力,可以提取网络中关于类别的核心信息,可以分离网络用于做出决策和区分相关类别所使用的单个特征。