低延迟可解释 AI 中的非均匀插值
本文针对 Integrated Gradients 在文本数据中由于词嵌入空间的固有离散性导致插值点不够具有代表性的问题,提出了基于离散化插值策略的 Discretized Integrated Gradients 方法,与 Integrated Gradients 方法相比,本方法计算出的梯度更符合实际情况,有效性得到了实验和人工评估的验证。
Aug, 2021
通过重视噪音源,提出了一种新的框架 ——IDGI,结合了 Reimann Integration 和 IG-based 的方法,可以在解释性指标上显著提高。
Mar, 2023
本研究提出了一种新的归因算法 (IDG) 用于神经网络模型的解释,该算法实现了通过将梯度积分到模型决策区域来解决饱和问题,该算法在 ImageNet 上进行的评估表明 IDG 在三个常见模型中以标准插入和删除度量标准在质量和量化上都优于 IG、left-IG、guided IG 和敌对梯度积分。
May, 2023
通过 xFAI 技术来阐述卷积神经网络 (CNN) 经常在解释中面临挑战,图像提取的像素等输入特征的固有复杂性产生复杂的相关性,以 Integrated Gradients (IG) 为代表的基于梯度的方法有效地展示了这些特征的重要性,然而,这些解释转化为图像通常会产生大量的噪声。我们引入了 GAD (Gradient Artificial Distancing) 作为基于梯度的技术的支持框架,其主要目标是通过建立类之间的区别来强调有影响力的区域。GAD 的本质是在可视化过程中限制分析范围,并因此减少图像噪声。经过对遮挡图像的实证研究表明,通过这种方法识别出的区域确实在促进类别区分方面起到关键作用。
Jan, 2024
该研究提出了一种新的基线方法 —— 最大熵基线,用于解释 Integrated Gradients 方法从而保证解释的可靠性,并结合线性变换不变性进行了改进性的模型评估实验。
Apr, 2022
本文介绍了广义整合梯度(GIG),是解释 ML 预测模型的输入变量的方法,并且相较于其他方法有很好的特性,适用于各种实际应用,特别是金融领域。我们证明了在合理的公理下,GIG 是解释混合型模型或游戏的唯一正确方法。
Sep, 2019
通过互联网入侵检测系统(IDS)与可解释人工智能(XAI)的集成,最近取得了显著的性能提升,通过精确的特征选择。然而,深入了解网络攻击需要 IDS 内部可解释的决策过程。本文提出了易于解释的泛化机制(IG),具有革新 IDS 能力的潜力。IG 区分出一致的模式,从而使其具有解释能力,可以区分正常和异常的网络流量。此外,一致模式的合成揭示了复杂的入侵路径,为网络安全取证提供了重要见解。通过与实际数据集 NSL-KDD、UNSW-NB15 和 UKM-IDS20 的实验,IG 即使在低比例的训练和测试中也能取得较高的准确性。在 NSL-KDD 中,当比例为 10% 至 90% 时,IG 的准确率(PRE)为 0.93,召回率(REC)为 0.94,曲线下面积(AUC)为 0.94;在 UNSW-NB15 中,IG 的 PRE 为 0.98,REC 为 0.99,AUC 为 0.99;在 UKM-IDS20 中,IG 的 PRE 为 0.98,REC 为 0.98,AUC 为 0.99。值得注意的是,在 UNSW-NB15 中,IG 在 40% 至 60% 时实现 REC=1.0,至少 PRE=0.98;在 UKM-IDS20 中,IG 在 20% 至 80% 时实现 REC=1.0,至少 PRE=0.88。在 UKM-IDS20 中,IG 成功识别出所有三个异常实例,说明其具有泛化能力。这些结果和推论是可复现的。总之,IG 通过在各种数据集和训练和测试比例(从 10% 至 90% 到 90% 至 10%)之间始终表现出色,并且在没有先前接触的情况下优秀地识别新的异常,展示了卓越的泛化能力。其可解释性通过准确区分正常和异常活动的一致证据得到增强,显著提高了检测准确性,降低了误报,从而增强了 IDS 的可靠性和可信度。
Mar, 2024
本文提出了自适应路径方法(APM)以及其特例 Guided IG 方法,通过调整归因路径本身(而非仅减少结果中的噪声)来解决在视觉模型上应用 Integrated Gradients 方法产生噪声像素归因的问题,并实验证明其在几乎所有实验中优于其他相关方法,可以创建与模型预测和图像输入更加一致的显著性地图。
Jun, 2021
提出一种新的用于深度学习的优化算法,Adaptive Learning-rates for Interpolation with Gradients(ALI-G)。
Jun, 2019