超越 TreeSHAP:用于树集成的任意阶 Shapley 互作用的高效计算
该研究提出了一种基于采样的计算 Shapley interaction 的新方法 SHAP-IQ,可以用于所有符合线性、对称和虚拟公理的定义,理论上保证了其逼近质量,并提供了点估计的方差估计。该方法极大地简化了 SV 的计算,效率和效果得到了验证。
Mar, 2023
该研究论文提出了一种对机器学习模型进行解释的方法,通过使用 Shapley value(沙普利价值)和 Shapley Interaction Index(沙普利相互作用指数)来分析黑盒机器学习模型中的信用分配问题,并且给出了一种称为 KernelSHAP-IQ 的方法来解决特征相互作用的问题。
May, 2024
本文提出了多种方法,可以在多项式时间内准确计算 SHAP 值,适用于不同类型的模型结构信息,包括已知功能分解、已知模型顺序和未知模型顺序,其中的方法在实际应用中计算效率高且准确性较高。
Sep, 2023
该论文提出一种称为 Shapley-Taylor 指数的方法来解决归因问题,并使用交互分布公理将其公理化,并将其应用于模型中以识别有趣的定性洞见。
Feb, 2019
本研究探讨了实例级特征重要性评分作为模型解释方法,并提出两种线性复杂度的算法来评估图结构数据中的特征贡献,并与其他模型解释方法进行比较。
Aug, 2018
本文提出了一种名为 STI-KNN 的算法,可在 O (t n^2) 时间内计算 KNN 模型的精确对交互 Shapley 值,并有效且准确地评估个体数据点的价值,从而提高人工智能应用的效果。
Apr, 2023
Shapley 值是一种广泛接受和可信赖的工具,用于解决深度神经网络等黑盒模型所带来的挑战。本研究分析了现有工作的一致性,并推断出随机估计器可以统一为特征子集重要性采样的线性变换。基于此,我们探讨设计简单的摊销估计器的可能性,并提出了一种简单高效的方法 ——SimSHAP,通过消除冗余技术。在表格和图像数据集上进行的大量实验证实了我们的 SimSHAP 的有效性,能够显著加速准确 Shapley 值的计算。
Nov, 2023
本文介绍了 EmSHAP(基于能量模型的 Shapley 值估计),它可以有效地近似预测模型在任意特征子集上的 Shapley 贡献函数的期望值。通过引入门控循环单元(GRU)将输入特征映射到隐藏空间,以消除输入特征排序的影响,并提出了动态屏蔽方案来提高泛化能力。定理 1、2 和 3 证明了 EmSHAP 比 KernelSHAP 和 VAEAC 等现有方法具有更紧的误差界限,从而实现了更高的估计精度。最后,针对医学和工业领域的应用案例表明,所提出的基于 Shapley 值的可解释框架具有提高的估计精度而无需牺牲效率。
Apr, 2024
本论文提出了 Myerson-Taylor 互动指数,将图结构内化到节点值和节点之间的互动值之中,并使用 Myerson-Taylor 结构感知图解释器(MAGE)基于二阶 Myerson-Taylor 指数识别影响模型预测的最重要模体。通过在各种图数据集和模型上进行广泛实验,我们证明了与现有方法相比,我们的方法始终提供更好的子图解释。
May, 2024
针对解释树集成方法(如梯度提升机和随机森林)结果的重要性,提出了 SHAP 值作为唯一一致及本地精确的归因值方法,并采用丰富的可视化方式改进归因总结和偏关系图,并提出了一种独特的 “受监督” 聚类方法。
Feb, 2018