低延迟可解释 AI 中的非均匀插值

Feb, 2023

Non-Uniform Interpolation in Integrated Gradients for Low-Latency Explainable-AI

Ashwin Bhat, Arijit Raychowdhury

TL;DR本研究提出了一种新的算法优化方法，通过硬件感知将 Integrated Gradients 算法加速，使其在保证收敛的同时，显著减少总插值步骤并提高了性能，同时我们在 ImageNet 数据集上进行的实验进一步验证了该算法的有效性。

Abstract

There has been a surge in explainable-ai (XAI) methods that provide insights into the workings of deep neural network (DNN) models. integrated gr

explainable-ai deep neural network integrated gradients algorithm optimization imagenet

发现论文，激发创造

用离散化的综合梯度来解释语言模型

本文针对 Integrated Gradients 在文本数据中由于词嵌入空间的固有离散性导致插值点不够具有代表性的问题，提出了基于离散化插值策略的 Discretized Integrated Gradients 方法，与 Integrated Gradients 方法相比，本方法计算出的梯度更符合实际情况，有效性得到了实验和人工评估的验证。

Aug, 2021

IDGI: 从 Integrated Gradients 中消除解释噪声的框架

通过重视噪音源，提出了一种新的框架 ——IDGI，结合了 Reimann Integration 和 IG-based 的方法，可以在解释性指标上显著提高。

Mar, 2023

集成决策梯度：在模型做出决策的地方计算您的属性

本研究提出了一种新的归因算法 (IDG) 用于神经网络模型的解释，该算法实现了通过将梯度积分到模型决策区域来解决饱和问题，该算法在 ImageNet 上进行的评估表明 IDG 在三个常见模型中以标准插入和删除度量标准在质量和量化上都优于 IG、left-IG、guided IG 和敌对梯度积分。

May, 2023

IG2：特征归因的迭代梯度路径上的综合梯度

特征归因方法 IG2 整合了梯度的正常输出和反事实输出，提高了特征归因的准确性，并证明在多个领域取得了优于现有技术的结果。

Jun, 2024

将基于梯度的技术转化为可解释方法

通过 xFAI 技术来阐述卷积神经网络 (CNN) 经常在解释中面临挑战，图像提取的像素等输入特征的固有复杂性产生复杂的相关性，以 Integrated Gradients (IG) 为代表的基于梯度的方法有效地展示了这些特征的重要性，然而，这些解释转化为图像通常会产生大量的噪声。我们引入了 GAD (Gradient Artificial Distancing) 作为基于梯度的技术的支持框架，其主要目标是通过建立类之间的区别来强调有影响力的区域。GAD 的本质是在可视化过程中限制分析范围，并因此减少图像噪声。经过对遮挡图像的实证研究表明，通过这种方法识别出的区域确实在促进类别区分方面起到关键作用。

Jan, 2024

综合梯度的最大熵基线

该研究提出了一种新的基线方法 —— 最大熵基线，用于解释 Integrated Gradients 方法从而保证解释的可靠性，并结合线性变换不变性进行了改进性的模型评估实验。

Apr, 2022

广义集成梯度：解释多元集成的实用方法

本文介绍了广义整合梯度（GIG），是解释 ML 预测模型的输入变量的方法，并且相较于其他方法有很好的特性，适用于各种实际应用，特别是金融领域。我们证明了在合理的公理下，GIG 是解释混合型模型或游戏的唯一正确方法。

Sep, 2019

一种可解释的泛化机制用于准确检测异常并识别网络入侵技术

通过互联网入侵检测系统（IDS）与可解释人工智能（XAI）的集成，最近取得了显著的性能提升，通过精确的特征选择。然而，深入了解网络攻击需要 IDS 内部可解释的决策过程。本文提出了易于解释的泛化机制（IG），具有革新 IDS 能力的潜力。IG 区分出一致的模式，从而使其具有解释能力，可以区分正常和异常的网络流量。此外，一致模式的合成揭示了复杂的入侵路径，为网络安全取证提供了重要见解。通过与实际数据集 NSL-KDD、UNSW-NB15 和 UKM-IDS20 的实验，IG 即使在低比例的训练和测试中也能取得较高的准确性。在 NSL-KDD 中，当比例为 10% 至 90% 时，IG 的准确率（PRE）为 0.93，召回率（REC）为 0.94，曲线下面积（AUC）为 0.94；在 UNSW-NB15 中，IG 的 PRE 为 0.98，REC 为 0.99，AUC 为 0.99；在 UKM-IDS20 中，IG 的 PRE 为 0.98，REC 为 0.98，AUC 为 0.99。值得注意的是，在 UNSW-NB15 中，IG 在 40% 至 60% 时实现 REC=1.0，至少 PRE=0.98；在 UKM-IDS20 中，IG 在 20% 至 80% 时实现 REC=1.0，至少 PRE=0.88。在 UKM-IDS20 中，IG 成功识别出所有三个异常实例，说明其具有泛化能力。这些结果和推论是可复现的。总之，IG 通过在各种数据集和训练和测试比例（从 10% 至 90% 到 90% 至 10%）之间始终表现出色，并且在没有先前接触的情况下优秀地识别新的异常，展示了卓越的泛化能力。其可解释性通过准确区分正常和异常活动的一致证据得到增强，显著提高了检测准确性，降低了误报，从而增强了 IDS 的可靠性和可信度。

Mar, 2024

引导式集成梯度：一种用于去除噪声的自适应路径方法

本文提出了自适应路径方法（APM）以及其特例 Guided IG 方法，通过调整归因路径本身（而非仅减少结果中的噪声）来解决在视觉模型上应用 Integrated Gradients 方法产生噪声像素归因的问题，并实验证明其在几乎所有实验中优于其他相关方法，可以创建与模型预测和图像输入更加一致的显著性地图。

Jun, 2021

训练神经网络通过插值

提出一种新的用于深度学习的优化算法，Adaptive Learning-rates for Interpolation with Gradients（ALI-G）。

Jun, 2019