超越 TreeSHAP：用于树集成的任意阶 Shapley 互作用的高效计算

Jan, 2024

超越 TreeSHAP：用于树集成的任意阶 Shapley 互作用的高效计算

Beyond TreeSHAP: Efficient Computation of Any-Order Shapley Interactions for Tree Ensembles

Maximilian Muschalik, Fabian Fumagalli, Barbara Hammer, Eyke Hüllermeier

TL;DRTreeSHAP-IQ 是一种高效的方法，用于计算基于树的模型预测的任意阶可加性 Shapley 相互作用，并通过数学框架支持，利用多项式算术在树的单个递归遍历中计算相互作用分数。

Abstract

While shallow decision trees may be interpretable, larger ensemble models like gradient-boosted trees, which often set the state of the art in machine learning problems involving tabular data, still remain black box models. As a remedy, the →

gradient-boosted trees shapley value treeshap methodology shapley interactions treeshap-iq

发现论文，激发创造

SHAP-IQ：任意阶 Shapley 交互的统一逼近

该研究提出了一种基于采样的计算 Shapley interaction 的新方法 SHAP-IQ，可以用于所有符合线性、对称和虚拟公理的定义，理论上保证了其逼近质量，并提供了点估计的方差估计。该方法极大地简化了 SV 的计算，效率和效果得到了验证。

Mar, 2023

KernelSHAP-IQ: Shapley 交互的加权最小二乘优化

该研究论文提出了一种对机器学习模型进行解释的方法，通过使用 Shapley value（沙普利价值）和 Shapley Interaction Index（沙普利相互作用指数）来分析黑盒机器学习模型中的信用分配问题，并且给出了一种称为 KernelSHAP-IQ 的方法来解决特征相互作用的问题。

May, 2024

利用模型结构信息高效计算 SHAP

本文提出了多种方法，可以在多项式时间内准确计算 SHAP 值，适用于不同类型的模型结构信息，包括已知功能分解、已知模型顺序和未知模型顺序，其中的方法在实际应用中计算效率高且准确性较高。

Sep, 2023

Shapley Taylor 交互指数

该论文提出一种称为 Shapley-Taylor 指数的方法来解决归因问题，并使用交互分布公理将其公理化，并将其应用于模型中以识别有趣的定性洞见。

Feb, 2019

L-Shapley 和 C-Shapley：用于结构化数据的高效模型解释

本研究探讨了实例级特征重要性评分作为模型解释方法，并提出两种线性复杂度的算法来评估图结构数据中的特征贡献，并与其他模型解释方法进行比较。

Aug, 2018

将数据 Shapley 交互计算从 O (2^n) 优化至 O (t n^2)—— 以 KNN 模型为例

本文提出了一种名为 STI-KNN 的算法，可在 O (t n^2) 时间内计算 KNN 模型的精确对交互 Shapley 值，并有效且准确地评估个体数据点的价值，从而提高人工智能应用的效果。

Apr, 2023

探索快速 Shapley 值估计的统一视角

Shapley 值是一种广泛接受和可信赖的工具，用于解决深度神经网络等黑盒模型所带来的挑战。本研究分析了现有工作的一致性，并推断出随机估计器可以统一为特征子集重要性采样的线性变换。基于此，我们探讨设计简单的摊销估计器的可能性，并提出了一种简单高效的方法 ——SimSHAP，通过消除冗余技术。在表格和图像数据集上进行的大量实验证实了我们的 SimSHAP 的有效性，能够显著加速准确 Shapley 值的计算。

Nov, 2023

基于能量模型的准确 Shapley 值估计用于解释性深度学习预测建模

本文介绍了 EmSHAP（基于能量模型的 Shapley 值估计），它可以有效地近似预测模型在任意特征子集上的 Shapley 贡献函数的期望值。通过引入门控循环单元（GRU）将输入特征映射到隐藏空间，以消除输入特征排序的影响，并提出了动态屏蔽方案来提高泛化能力。定理 1、2 和 3 证明了 EmSHAP 比 KernelSHAP 和 VAEAC 等现有方法具有更紧的误差界限，从而实现了更高的估计精度。最后，针对医学和工业领域的应用案例表明，所提出的基于 Shapley 值的可解释框架具有提高的估计精度而无需牺牲效率。

Apr, 2024

通过结构感知交互指数解释图神经网络

本论文提出了 Myerson-Taylor 互动指数，将图结构内化到节点值和节点之间的互动值之中，并使用 Myerson-Taylor 结构感知图解释器（MAGE）基于二阶 Myerson-Taylor 指数识别影响模型预测的最重要模体。通过在各种图数据集和模型上进行广泛实验，我们证明了与现有方法相比，我们的方法始终提供更好的子图解释。

May, 2024

树集成的一致个性化特征归因

针对解释树集成方法（如梯度提升机和随机森林）结果的重要性，提出了 SHAP 值作为唯一一致及本地精确的归因值方法，并采用丰富的可视化方式改进归因总结和偏关系图，并提出了一种独特的 “受监督” 聚类方法。

Feb, 2018