深度神经网络可解释性方法评估基准

Jun, 2018

深度神经网络可解释性方法评估基准

A Benchmark for Interpretability Methods in Deep Neural Networks

Sara Hooker, Dumitru Erhan, Pieter-Jan Kindermans, Been Kim

TL;DR本文提出了一种衡量深度神经网络特征重要性估计的近似准确性的经验方法，研究发现，在许多流行的可解释性方法中，只有某些集成方法，如 VarGrad 和 SmoothGrad-Squared，才能胜任随机指定特征重要性的任务。

Abstract

We propose an empirical measure of the approximate accuracy of feature importance estimates in deep neural networks. Our results across several large-scale image classification datasets show that many popular interpreta

feature importance deep neural networks interpretability methods ensemble based approaches vargrad

发现论文，激发创造

神经文本分类器的鲁棒可解释性缺失

本研究通过两种随机化测试，评估预训练 Transformer 编码器的神经文本分类器的可解释性解释的鲁棒性，并发现出乎意料的偏差，从而对实践者从解释中获得的深入的见解提出疑问。

Jun, 2021

为深度神经网络基准测试可解释性工具

本文提出 Trojan rediscovery 作为一项基准测试任务，以评估可解释性工具生成工程相关见解的实用价值，并设计了两种基准测试方法。最终将这些方法应用到 16 个特征归因 / 显著性方法和 9 个特征合成方法中，发现了现有工具之间的巨大差异，并指出了未来研究的方向。

Feb, 2023

机器学习方法应用于神经影像的可解释性

本篇论文介绍了最常见的解释性方法和评估可靠性的指标，并探讨了它们在神经影像学方面的应用和基准测试。

Apr, 2022

神经网络解释方法真的好吗？量化基准测试

本文提出了一种基于合成数据集的神经网络解释方法的量化基准评估，结果表明我们的合成数据集足以挑战大多数基准方法，而 TreeShap、mRMR 和 LassoNet 是最佳表现的 FS（特征选择）方法，并且当评估少数非线性交绉的预测特征时，神经网络基础的 FS 和解释方法仍然不可靠。

Apr, 2023

深度学习分类器中的重要性估计器在计算机断层扫描中的评估

本文研究了几种不同的特征重要性估计方法用于解释卷积深度神经网络对计算机断层扫描（Computed Tomography，CT）图像分类的性能，结论是不同的估计方法对不同准则的性能评估表现不同，同时，专家注释的分割图像与模型到达的预测结果之间存在差异，意识到了解释性差异可以帮助深度学习在医学领域的应用。

Sep, 2022

如何将深度视觉解释应用于时间序列

该研究提出了一个包含六个度量标准的框架，可以用于评估时间序列分类和分割任务中的可视化解释方法的可靠质量度量，并评估了多种流行神经网络架构在不同数据集上的表现，从而为领域专家提供选择适当可视化技术的建议。

Mar, 2022

推广基于梯度的解释性反向传播

通过使用半环，我们将反向传播算法推广到神经网络的梯度图的其他可解释统计量的高效计算，以识别深度神经网络中的重要特征、组件和自注意机制的路径。

Jul, 2023

深度神经网络的基于梯度的解释方法 —— 鲁棒性解释指南

本文介绍了解释深度神经网络的渐变解释性方法，讨论了这些方法如何评估其鲁棒性以及鲁棒性在产生有意义的解释方面的作用，并探讨了渐变方法的局限性和选择解释方法之前应该考虑的最佳实践和属性。

Jul, 2021

关于可证实解释性研究的探索

本文介绍了深度神经网络的可解释性研究及其方法，指出目前的方法存在的局限和风险，并提出了以可证伪性为核心的新的研究框架，目的是为了产生更具意义和可靠的可解释性方法。

Oct, 2020

基于树模型和替代模型的公平特征重要性评分

我们提出了一种公平特征重要性评分，用于解释决策树等可解释的黑盒机器学习模型对公平性或偏见的贡献。通过模拟和真实示例，我们证明了该方法对树形集成和其他机器学习系统的树形替代物提供了有效的解释性。

Oct, 2023