利用模型结构信息高效计算 SHAP

Sep, 2023

Computing SHAP Efficiently Using Model Structure Information

Linwei Hu, Ke Wang

TL;DR本文提出了多种方法，可以在多项式时间内准确计算 SHAP 值，适用于不同类型的模型结构信息，包括已知功能分解、已知模型顺序和未知模型顺序，其中的方法在实际应用中计算效率高且准确性较高。

Abstract

shap (SHapley Additive exPlanations) has become a popular method to attribute the prediction of a machine learning model on an input to its features. One main challenge of shap is the →

shap computation time approximation methods additive property iterative approximation

发现论文，激发创造

SHAP 解释的可处理性研究

本文研究了 SHAP 解释机制在计算复杂度上的困难度，并在三个重要场景下进行了探究，结果表明 SHAP 解释在常见的机器学习模型中的计算量是很高的。

Sep, 2020

FastSHAP: 实时 Shapley 值估计

FastSHAP 是一种使用学习解释器模型在一次正向传递中估计 Shapley 值的方法，通过启发 Shapley 值加权最小二乘估计的学习方法来分摊解释许多输入的成本，并且可以使用标准的随机梯度优化进行训练，与现有的估计方法进行比较，显示出具有高质量解释的数量级加速。

Jul, 2021

当特征具有依赖性时解释单个预测：更准确的 Shapley 值逼近

本文介绍了使用 Shapley 值框架及其高维的计算有效近似，使复杂机器学习模型在解释各远行预测时更具可解释性，同时提出了处理相关特征的方法，增强了解释精度。

Mar, 2019

探索快速 Shapley 值估计的统一视角

Shapley 值是一种广泛接受和可信赖的工具，用于解决深度神经网络等黑盒模型所带来的挑战。本研究分析了现有工作的一致性，并推断出随机估计器可以统一为特征子集重要性采样的线性变换。基于此，我们探讨设计简单的摊销估计器的可能性，并提出了一种简单高效的方法 ——SimSHAP，通过消除冗余技术。在表格和图像数据集上进行的大量实验证实了我们的 SimSHAP 的有效性，能够显著加速准确 Shapley 值的计算。

Nov, 2023

简洁的互动感知解释

我们提出了一种将特征分割为显著相互作用的部分，并利用这些部分形成简明易解的加性解释的方法。实验证明，我们的解释比 SHAP 和 NSHAP 的解释更准确、更易理解。

Feb, 2024

解释模型预测的统一方法

研究为什么一个模型做出某个特定的预测与预测准确性一样重要，然而对于像集成或深度学习模型这样的复杂模型，即使是专家也难以解释其高精度，因此需要各种方法来帮助解释预测，其中一个新方法，SHAP（Shapley Additive Explanations），通过为每个特征指定一个重要性值来解释预测。

May, 2017

关于马尔可夫分布下 SHAP 解释的可处理性

通过引入马尔可夫视角，我们研究了 SHAP 得分的计算复杂性，并在一些模型类中展示了多项式时间内计算 SHAP 得分的积极复杂性结果，从而超越特征独立性假设的限制。

May, 2024

超越 TreeSHAP：用于树集成的任意阶 Shapley 互作用的高效计算

TreeSHAP-IQ 是一种高效的方法，用于计算基于树的模型预测的任意阶可加性 Shapley 相互作用，并通过数学框架支持，利用多项式算术在树的单个递归遍历中计算相互作用分数。

Jan, 2024

使用整合回归逼近基于分数的解释技术

我们提出并研究了使用计算成本较低的回归模型来逼近诸如 SHAP 之类的基于分数解释技术的输出，通过采用归纳符合预测框架提供了对逼近值的有效性保证。我们提出了几种非一致性度量方法，旨在考虑到解释逼近的困难程度同时保持计算成本的低廉。通过大规模实证研究的结果表明，我们提出的模型生成的近似解释在效率（区间大小）方面得到了评估。结果表明，与快速版本的 SHAP TreeSHAP 相比，所提出的方法可以显著提高执行时间。结果还表明，所提出的方法可以产生紧密的区间，同时提供有效性保证。此外，所提出的方法允许比较不同逼近方法的解释，并根据预测区间的信息量（紧密程度）选择一种方法。

Aug, 2023

L-Shapley 和 C-Shapley：用于结构化数据的高效模型解释

本研究探讨了实例级特征重要性评分作为模型解释方法，并提出两种线性复杂度的算法来评估图结构数据中的特征贡献，并与其他模型解释方法进行比较。

Aug, 2018