利用控制变量稳定 Shapley 值的估计

Oct, 2023

利用控制变量稳定 Shapley 值的估计

Stabilizing Estimates of Shapley Values with Control Variates

Jeremy Goldwasser, Giles Hooker

TL;DR使用 Monte Carlo 控制变量技术的 ControlSHAP 方法可以有效减少 Shapley 估计的 Monte Carlo 变异性。

Abstract

shapley values are among the most popular tools for explaining predictions of blackbox machine learning models. However, their high computational cost motivates the use of sampling approximations, inducing a cons

shapley values blackbox machine learning models monte carlo technique controlshap uncertainty

发现论文，激发创造

估计条件 Shapley 值方法的比较研究及其应用

本文主要研究如何使用 Monte Carlo 积分或回归来模拟条件期望值以估计 Shapley 值，以及对现有方法进行改进和系统化分类，并进行广泛的模拟和实际数据实验来评估和推荐何时使用不同的方法类。

May, 2023

通过线性回归改进 KernelSHAP：实用的 Shapley 值估算

本文探讨了如何通过线性回归来有效估计机器学习模型的 Shapley 值，并提出了一种方差缩减技术，以加速两个估计器的收敛速度。此外，还发现了一种新的无偏版本 KernelSHAP，并提出了一种针对随机合作博弈的方法，可产生两个全局解释方法的快速新估计器。

Dec, 2020

探索快速 Shapley 值估计的统一视角

Shapley 值是一种广泛接受和可信赖的工具，用于解决深度神经网络等黑盒模型所带来的挑战。本研究分析了现有工作的一致性，并推断出随机估计器可以统一为特征子集重要性采样的线性变换。基于此，我们探讨设计简单的摊销估计器的可能性，并提出了一种简单高效的方法 ——SimSHAP，通过消除冗余技术。在表格和图像数据集上进行的大量实验证实了我们的 SimSHAP 的有效性，能够显著加速准确 Shapley 值的计算。

Nov, 2023

变分 Shapley 网络：基于概率的自解释 Shapley 值与不确定性量化方法

我们引入了一种新颖的、能够显著简化 Shapley 值计算的自解释方法，并且探索了将概率框架纳入其中以捕捉解释中固有的不确定性，它基于一个新颖的遮蔽神经网络体系结构，在模拟和真实数据集上的评估验证了我们技术的稳健预测和解释性能。

Feb, 2024

数据评估的加速 Shapley 值近似算法

通过利用机器学习问题的结构性质，我们提出了一种更高效的近似数据 Shapley 值的方法，此方法在不同学习设置中包括随机梯度下降和凸、非凸损失函数中证明了其近似 Shapley 值的准确性收敛性。实验证明，这种方法在保持数据的近似价值和排名的同时，提高了近似速度最高可达 9.9 倍，并且在使用小的子集进行精确评估时，对预训练网络的效率更高。

Nov, 2023

FastSHAP: 实时 Shapley 值估计

FastSHAP 是一种使用学习解释器模型在一次正向传递中估计 Shapley 值的方法，通过启发 Shapley 值加权最小二乘估计的学习方法来分摊解释许多输入的成本，并且可以使用标准的随机梯度优化进行训练，与现有的估计方法进行比较，显示出具有高质量解释的数量级加速。

Jul, 2021

基于采样的 Shapley 值估计误差的界限

本篇论文研究了在合作博弈中划分奖励的规范解概念 “Shapley value” 的计算难度，并提出了非渐进的估算误差范围和采用分层抽样方法进一步提高准确度的方法。

Jun, 2013

个体 Shapley 值解释的精确性

Shapley value explanations are less precise for observations on the outer region of the training data distribution, which has not been systematically addressed in the Shapley value literature.

Dec, 2023

一个多线性采样算法用于估计 Shapley 值

本论文提出了一种基于多线性扩展技术的新采样方法来估计 Shapley 值，可用于任何机器学习模型，特别是多类分类或回归问题。通过对两个数据集的实验，我们证明了该方法通过减少采样统计变量的方差来提供更准确的 Shapley 值估计。

Oct, 2020

当特征具有依赖性时解释单个预测：更准确的 Shapley 值逼近

本文介绍了使用 Shapley 值框架及其高维的计算有效近似，使复杂机器学习模型在解释各远行预测时更具可解释性，同时提出了处理相关特征的方法，增强了解释精度。

Mar, 2019