神经网络稳健可解释性的因果分析

May, 2023

神经网络稳健可解释性的因果分析

Causal Analysis for Robust Interpretability of Neural Networks

Ola Ahmad, Nicolas Bereux, Vahid Hashemi, Freddy Lecue

TL;DR本文提出了一种基于因果分析的鲁棒性干预方法，以捕获神经网络内部的因果机制，从而审核模型行为，获得更加稳定和可信的解释，该方法适用于图像分类等任务。

Abstract

Interpreting the inner function of neural networks is crucial for the trustworthy development and deployment of these black-box models. Prior interpretability methods focus on correlation-based measures to attribute model decisions to individual examples. However, these measures are su

neural network interpretability causal analysis model behavior image classification

发现论文，激发创造

神经网络中因果归因学习：超越直接影响

本文研究了神经网络中因果关系的估计及维护，提出了一种有效的方法来捕获和维护直接和间接的因果关系，并在高维数据中量化因果属性。通过实验验证此方法学习的因果属性能够接近于真实效果。

Mar, 2023

神经网络归因：因果视角

提出了一种基于因果原理的神经网络归因方法，其中将神经网络架构视为结构因果模型，并提出了计算每个特征对输出的因果效应的方法，这种方法可以高效处理具有大量特征的数据，并在模拟和真实数据集上进行了实验验证。

Feb, 2019

神经网络健壮性的因果视角

本论文提出了一种基于因果关系视角的神经网络输入鲁棒性分析方法，提出了深度因果操纵增强模型（CAMA），解决了单因素影响的问题，并采用了数据增强和测试时间微调方法以提升模型鲁棒性。相较于基于判别模型的深度学习神经网络，该模型表现出了更好的抵抗未知操纵攻击的能力，并成功实现了操纵信息与其他潜在因素的解耦合表示。

May, 2020

因果学习：可解释机器学习的新视角

本文概述了因果分析的基本背景和关键概念，总结了最近的可解释机器学习的因果方法，讨论了评估方法质量和因果可解释性中的开放问题。

Jun, 2020

使用自解释神经网络的 Granger 因果关系可解释模型

本文提出了一种基于自解释神经网络的非线性动力学下多元格兰杰因果推断的新框架，该框架除了关系推断外，还允许检测格兰杰因果效应的符号并检查其随时间的变化，通过模拟数据等实验表明该框架与其他基线方法相比在推断格兰杰因果性方面具有相当的性能，并在推断交互符号方面取得更好的表现，这表明本框架是推断格兰杰因果性的可行且更易解释的替代方法。

Jan, 2021

机器学习的因果可解释性：问题、方法和评估

本文综述了因果可解释模型的问题和方法，并深入探讨了用于衡量解释度的评估度量标准，从而帮助实践者了解每种评估度量标准适用于哪些场景。

Mar, 2020

CausalAdv：因果视角下的对抗鲁棒性

本文利用因果分析来建模敌对攻击的产生过程，并定义敌对分布以形式化敌对攻击的直观；通过因果解释，本文提出了一种由 Causal inspired Adversarial distribution alignment 方法，CausalAdv，以消除自然分布和敌对分布之间差异的方法，并证明了该方法的有效性。

Jun, 2021

通过自编码激活实现深度神经网络的因果学习和解释

通过构建深度神经网络中的因果模型并使用自动编码器提取关键概念作为变量，我们开发了一种解释神经网络输出预测的方法，并使用该因果模型识别和可视化对最终分类具有显着因果影响的特征。

Feb, 2018

典型计算机视觉任务中的因果推理

基于深度学习的方法已经颠覆了人工智能领域。本文综述了在典型的计算机视觉和视觉语言任务中，深度学习的基础、稳定性以及存在的问题，并总结了因果理论对解决这些问题的优势以及构建因果模型的方法。未来的规划包括促进因果理论的发展并在其他复杂场景和系统中应用。

Jul, 2023

关于可证实解释性研究的探索

本文介绍了深度神经网络的可解释性研究及其方法，指出目前的方法存在的局限和风险，并提出了以可证伪性为核心的新的研究框架，目的是为了产生更具意义和可靠的可解释性方法。

Oct, 2020