Shapley 协同精炼解释黑盒决策

Nov, 2019

Explaining black box decisions by Shapley cohort refinement

Masayoshi Mase, Art B. Owen, Benjamin Seiler

TL;DR我们提出了一种变量重要性度量，基于博弈论中的 Shapley 值，用于量化黑盒函数中各个输入变量的影响。我们的度量基于观察数据分组来计算，连接了可解释 AI 领域的变量重要性度量和全局敏感性分析的函数分解方法，并引入了一个平方 Shapley 值，可以将原来研究中的 Shapley 效应分解到不同的观测数据组之间。

Abstract

We introduce a variable importance measure to quantify the impact of individual input variables to a black box function. Our measure is based on the →

variable importance shapley value black box function predictor explainable ai

发现论文，激发创造

无法实现数据的变量重要性

使用合作谢普利方法（Cohort Shapley）来验证黑盒预测算法的重要变量，并通过经济博弈理论来量化变量的重要性。该方法可以用于算法公平性问题，以确定受保护变量的重要性，并通过贝叶斯自助法估计 Shapley 值的不确定性。

May, 2022

关于测量相关输入重要性的 Shapley 值

本文介绍了使用 Shapley 值来量化函数中随机输入变量的重要性，并探讨了基于 ANOVA 分解的替代方案在输入变量存在相关性时存在的概念和计算问题。通过一些简单的示例，我们说明 Shapley 值可以消除这些问题并产生直观合理的闭式数值。

Oct, 2016

L-Shapley 和 C-Shapley：用于结构化数据的高效模型解释

本研究探讨了实例级特征重要性评分作为模型解释方法，并提出两种线性复杂度的算法来评估图结构数据中的特征贡献，并与其他模型解释方法进行比较。

Aug, 2018

基于 Shapley 值的解释存在的特征重要性度量问题

采用博弈论方法计算机器学习模型特征重要性的数学问题存在和 Shapley 值并不能很好地解释人类可解释目标的论证以及需要因果推理等技术增加复杂性。

Feb, 2020

高维数据的无模型 Shapley 值

本文提出了一个称为集体 Shapley（CS）方法，具有指数成本，以及需要第二个黑匣子模型作为输入的受监督的流形 Shapley 方法。并且引入了一种名为 IGCS 的集成梯度版本的 cohort Shapley，通过某些曲线下面积度量证明其性能与 CS 几乎相同。

Nov, 2022

使用 Shapley Value 进行模型解释的预测和因果推论

本文探讨了 Shapley 值在贝叶斯网络框架下的应用，分析了 Shapley 值与条件独立性的关系，并发现高 Shapley 值的变量不一定对模型预测性能有显著影响，而低 Shapley 值的变量可能会导致较差的预测结果。因此，在一般情况下，使用 Shapley 值进行特征选择并不一定能建立起最简单和预测性最优的模型，而且 Shapley 值不反映变量与目标之间的因果关系。

Aug, 2020

解释博弈：使用 Shapley 值解释机器学习模型

本研究提出了一个新的机器学习模型解释框架 FAE（Formulate，Approximate，Explain）。该框架利用了 Shapley 值和博弈论方法进行解释，并提供了置信区间和对比解释来解释黑盒子模型在不同数据集上的结构。

Sep, 2019

一个高效的纳什均衡值计算方法用于朴素贝叶斯分类器

本文提出了 Shapley 值在朴素贝叶斯分类器中的确切分析表达式，并对其与证据权重和 KernelShap 在实际数据集上的结果进行了比较，结果表明我们的 Shapley 方案在算法复杂度低的情况下提供了具有信息量的结果，可以在大规模数据集上以极低的计算时间使用。

Jul, 2023

通过 Shapley 值的分解来解释模型和特征之间的依赖关系

本文提出了一种新的算法方法，将 Shapley 值中两种不同的解释组合在一起，以增强模型的说明能力，并在两个真实世界的数据集上应用。

Jun, 2023

个体 Shapley 值解释的精确性

Shapley value explanations are less precise for observations on the outer region of the training data distribution, which has not been systematically addressed in the Shapley value literature.

Dec, 2023