深度神经网络中每个神经元学习到的不同类型的特征的多方面可视化

Feb, 2016

深度神经网络中每个神经元学习到的不同类型的特征的多方面可视化

Multifaceted Feature Visualization: Uncovering the Different Types of Features Learned By Each Neuron in Deep Neural Networks

PDF

Anh Nguyen, Jason Yosinski, Jeff Clune

TL;DR通过深度可视化技术，可以更好地了解深度神经网络。本文介绍了一种算法，通过合成每种类型的图像来清晰地揭示神经元的多重特征，并引入正则化方法使可视化结果更具解释性和清晰性。

Abstract

We can better understand deep neural networks by identifying which features each of their neurons have learned to detect. To do so, researchers have created deep visualization techniques including →

deep neural networks deep visualization activation maximization multifaceted neurons interpretability of images

发现论文，激发创造

透過特徵視覺化理解神經網絡：一項調查

本章介绍了一种神经科学方法 ——Activation Maximization（AM），利用机器学习技术综合推理神经元的首选刺激，以大力激发人造或生物大脑中的单个细胞或细胞组，并讨论了现有 AM 技术的概率解释和其在网络调试和解释方面的应用。

Apr, 2019

通过渐变弹弓操控特征可视化

本文研究了 Deep Neural Networks (DNNs) 通过 Activation Maximization (AM) 方法学习的概念的语义特性，并介绍了一种在不改变模型架构或显著影响模型决策过程的情况下操纵特征可视化的新方法。我们评估了该方法在多个神经网络模型上的有效性，并展示了在模型审核过程中通过掩盖原始解释而隐藏特定神经元功能的能力。为了解决这个问题，我们提出了对抗此类操纵的一种保护措施，并提供了定量证据来支持我们的发现。

Jan, 2024

在人工和生物神经系统中识别可解释的视觉特征

在神经网络中，单个神经元往往是 “可解释的”，因为它们代表了个别直观有意义的特征。然而，许多神经元表现出混合选择性，即它们代表多个不相关的特征。最近的假设提出深度网络中的特征可能通过多个神经元以非正交的方式进行 “叠加”，因为自然数据中可解释的特征数量通常大于给定网络中的神经元数量。因此，我们应该能够在激活空间中找到与个别神经元不一致的有意义方向。在这里，我们提出了（1）一种自动化方法，用于量化视觉可解释性，并与人类心理物理学对神经元可解释性的大型数据库验证，以及（2）一种在网络激活空间中找到有意义方向的方法。我们利用这些方法在卷积神经网络中发现了比个别神经元更具直观意义的方向，通过一系列分析进行了确认和调查。此外，我们将相同的方法应用于大脑中两个最近的视觉神经响应数据集，并发现我们的结论在大部分转移到真实神经数据上，这表明大脑可能使用了叠加。这也与去纠缠有关，并在人工和生物神经系统中提出了关于稳健、高效和分解表示的基本问题。

Oct, 2023

特征强调：揭示自然图像中的哪些特征应对

解释可视化图像中神经网络特征响应的位置和内容的新方法：feature accentuation。

Feb, 2024

使用特征文本化方法研究 BERT 神经元中单词的编码

计算机视觉中可视化特征提供了一种将视觉模型的神经元信息分解解释的方法，我们的研究受到这一方法的启发并针对大型预训练语言模型进行了活化最大化的尝试；我们提出了特征文本化技术，用于提取预训练语言模型中神经元的知识表示，发现这些表示可以揭示关于神经元所编码的知识的见解，但神经元并不代表清晰的语言符号单元如词。

Nov, 2023

共享特征可视化的并行反向传播

使用基于深度学习的方法，通过对图像的激活进行建模，可以揭示大脑视觉区域中神经元的选择性和共享特征，进而理解为什么一些物体图像会激发这些神经元的反应。

May, 2024

神经元激活最大化的解释遭受对抗性攻击

本文提出并演示了一种优化框架，用于操纵模型以达到欺骗解释的目的，并展示了一些流行的激活最大化解释技术的若干种可以被操纵以改变解释的方式，揭示了这些方法的可靠性。

Jun, 2023

特征可视化有助于理解 CNN 激活的因果关系吗？

在解释性人工智能方面，通过激活最大化可视化单元响应是一种被广泛应用的方法，而此研究测试了此方法是否能有效的帮助人们预测激活单元的变化，结果表明其在一定程度上有帮助，但并没有明显优势。

Jun, 2021

卷积神经网络如何看待世界 - 卷积神经网络可视化方法综述

本文综述了通过 Activation Maximization、Network Inversion、Deconvolutional Neural Networks (DeconvNet) 以及 Network Dissection 等可视化手段实现 CNN 可解释性的方法，并探讨了这些方法在网络设计、优化和安全增强等领域中的实际应用价值。

Apr, 2018

利用深度生成网络合成神经网络内部神经元的首选输入

通过激活最大化算法，使用深度生成网络为神经网络内部的感知器学习特征提供先验知识，可以生成高质量的合成图像和可解释的特征，同时作为一种高质量的生成方法。

May, 2016