通过对特定类别过滤器微分训练可解释的卷积神经网络

ECCVJul, 2020

通过对特定类别过滤器微分训练可解释的卷积神经网络

Training Interpretable Convolutional Neural Networks by Differentiating Class-specific Filters

Haoyu Liang, Zhihao Ouyang, Yuyuan Zeng, Hang Su, Zihao He...

TL;DR本文主要介绍了一个用于训练卷积神经网络的新策略，通过向网络中添加可学习的稀疏 Class-Specific Gate 结构，以鼓励针对每个类别的滤波器，从而减轻 “黑盒” 问题和滤波器 - 类别缠结问题；通过在对象定位和对抗样本检测等应用中的实验证明，该方法比标准训练策略更加优异。

Abstract

convolutional neural networks (CNNs) have been successfully used in a range of tasks. However, CNNs are often viewed as "black-box" and lack of interpretability. One main reason is due to the →

convolutional neural networks interpretability filter-class entanglement class-specific filters sparse class-specific gate

发现论文，激发创造

可解释性卷积神经网络

本文提出了一种方法，将传统的 CNN 转换为可解释的 CNN，以澄清 CNN 高卷积层中的知识表示。在可解释的 CNN 中，高卷积层中的每个滤波器表示某个物体部分，无需任何部件或纹理的注释就可以在学习过程中自动分配。实验表明，可解释的 CNN 中的滤波器比传统 CNN 中的滤波器更具有语义意义。

Oct, 2017

可解释卷积神经网络的一条路径：PICNN

该论文引入了一种新的路径来缓解卷积神经网络中滤波器和图像类之间的纠缠，通过将 CNN 的滤波器分组到类别特定的簇中，实现了更好的可解释性和较高的区分能力。

Dec, 2023

基于 SincNet 的可解释卷积滤波器

本研究提出了一种新的卷积神经网络模型 ——SincNet，该模型可用于直接处理从原始波形中提取的语音，通过使用参数化 sinc 函数，鼓励第一层学习更有意义的滤波器，学习带通滤波器的低高截止频率可以从数据中直接进行，该模型比标准 CNN 模型具有更快的收敛速度，更好的性能和更好的可解释性，这在说话人识别和语音识别方面得到了很好的实验验证。

Nov, 2018

可解释的组合卷积神经网络

通过修改传统卷积神经网络，将其转化为可解释的组合卷积神经网络，以学习中间卷积层中编码有意义的视觉模式的滤波器，从而实现语义可解释的 AI，该方法可以广泛应用于不同类型的 CNN，并且实验效果良好。

Jul, 2021

理解卷积神经网络在文本分类中的应用

本文研究了卷积神经网络在文本处理中的工作原理。作者发现，使用不同的神经元激活模式可以捕获不同的语义类别的 N-gram，并且 Max-pooling 操作可以区分出重要的 N-gram。最后，作者给出了基于研究结果的实际应用，包括模型可解释性和预测可解释性。

Sep, 2018

朝着可解释的人脸识别

提出了一种基于深度卷积神经网络的面部识别方法，该方法通过结构化和特征多样性损失，学习易于解释的面部表示，并证明其在三个面部识别基准上提高了准确性。

May, 2018

使用条件生成对抗网络解释 CNN 预测

本文介绍了一种新方法，使用条件生成对抗网络（GAN）通过信息传递学习卷积神经网络（CNN）的图像处理和预测，同时解决了如何将信息传递到 GAN 的挑战和如何有效地训练 GAN 的问题，该方法通过中间层的平均交互地图来表达 CNN 的结构，通过两种交互方案的对比得出了 GAN 可有效解释 CNN 从而提高图像处理的实现效率。

Jan, 2023

揭示不可见的东西：训练的深度可分卷积核中的可识别聚类

最近在深度可分离卷积神经网络（DS-CNNs）方面的进展已经引发了新的架构，通过相当大的可扩展性和准确性优势，超越了经典 CNNs 的性能。本文揭示了 DS-CNN 架构的另一个引人注目的特性：它们训练后的深度卷积核在所有层中出现了明显可辨和可解释的模式。通过对数百万个训练滤波器的广泛分析，我们使用自编码器进行无监督聚类，对这些滤波器进行了分类。令人惊讶的是，这些模式汇聚成了几个主要簇，每个簇都类似于高斯差分函数（DoG）及其一阶和二阶导数。值得注意的是，我们能够将来自最先进的 ConvNextV2 和 ConvNeXt 模型的滤波器分别分类为 95％和 90％以上。这一发现不仅仅是技术上的奇特之处；它回应了神经科学家长期以来对哺乳动物视觉系统的基础模型的提议。因此，我们的结果加深了对训练后 DS-CNN 的出现属性的理解，并在人工和生物视觉处理系统之间提供了一个桥梁。更广泛地说，它们为未来更具可解释性和生物灵感的神经网络设计铺平了道路。

Jan, 2024

X-CNN: 跨模态卷积神经网络适用于稀疏数据集

本文提出了一种新颖的跨模态卷积神经网络（X-CNNs），通过在更大规模的网络拓扑中处理梯度下降专用的 CNN，允许在网络的类似隐藏层之间进行无限制的信息流和 / 或权重共享，具有很好的泛化能力，最终表现优于标准 CNN 和 FitNet4 架构，特别在稀疏数据环境中表现更佳

Oct, 2016

学习上下文敏感的卷积滤波器用于文本处理

本研究中提出一种使用小型元网络学习文本处理的上下文敏感卷积滤波器的方法，并将该框架进一步推广到模拟句子对，通过可视化学习的上下文敏感滤波器验证了所提出的框架的有效性。

Sep, 2017