Shapley值的因果分析：条件与边际

Sep, 2024

Causal Analysis of Shapley Values: Conditional vs. Marginal

Ilya Rozenfeld

TL;DR本研究聚焦于Shapley值的计算方法，特别是条件方法和边际方法在特征相关情况下导致的不一致结果。提出了通过因果论证解决这一争议的新颖方法，发现条件方法在因果角度上存在根本性缺陷，并推论出边际方法应优于条件方法。该研究为合理选择Shapley值计算方法提供了理论基础，具有重要的实用价值。

Abstract

Shapley Values, a game theoretic concept, has been one of the most popular tools for explaining Machine Learning (ML) models in recent years. Unfortunately, the two most common approaches, conditional and margina

发现论文，激发创造

模型解释的多个 Shapley 值

本文探讨了Shapley值在归因问题中的多样实现方式及产生的问题，且提出了一种基于独特性原理的技术Baseline Shapley（BShap），并将其与Integrated Gradients进行对比。

Aug, 2019

解释博弈：使用 Shapley 值解释机器学习模型

本研究提出了一个新的机器学习模型解释框架FAE（Formulate，Approximate，Explain）。该框架利用了Shapley值和博弈论方法进行解释，并提供了置信区间和对比解释来解释黑盒子模型在不同数据集上的结构。

Sep, 2019

基于 Shapley 值的解释存在的特征重要性度量问题

采用博弈论方法计算机器学习模型特征重要性的数学问题存在和Shapley值并不能很好地解释人类可解释目标的论证以及需要因果推理等技术增加复杂性。

Feb, 2020

遵循模型还是遵循数据的真实性？

该研究论文讨论了在机器学习中解释协作游戏的Shapley值的应用，特别是在特征归因方面。作者提出了两种主要方法来连接机器学习模型和协同游戏，并讨论了如何在模型和数据之间进行选择。此外，他们提出了一个有效的方法来计算线性模型中Shapley值，并在两个实际的数据案例中研究了与特征属性相关的建模选择。

Jun, 2020

使用 Shapley Value 进行模型解释的预测和因果推论

本文探讨了Shapley 值在贝叶斯网络框架下的应用，分析了Shapley 值与条件独立性的关系，并发现高Shapley值的变量不一定对模型预测性能有显著影响，而低Shapley值的变量可能会导致较差的预测结果。因此，在一般情况下，使用Shapley值进行特征选择并不一定能建立起最简单和预测性最优的模型，而且Shapley值不反映变量与目标之间的因果关系。

Aug, 2020

Shapley Flow：一种基于图的模型解释方法

提出了一种称之为Shapley Flow的新颖方法来解释机器学习模型，它可以考虑所有因果图，并将信用分配给边，而不是节点。

Oct, 2020

能否忠实地表示缺失状态以计算DNN中的Shapley值？

本文提出了一种基于因果关系的模型特征表示方法，探讨了基于屏蔽措施的归因方法的理论缺陷，证明了因果关系是 Shapley 值的基本原理，定义了最佳的基线值，并提出了一种通过学习得到最佳基线值的方法，实验结果证明了该方法的有效性。

May, 2021

估计条件Shapley值方法的比较研究及其应用

本文主要研究如何使用 Monte Carlo 积分或回归来模拟条件期望值以估计 Shapley 值，以及对现有方法进行改进和系统化分类，并进行广泛的模拟和实际数据实验来评估和推荐何时使用不同的方法类。

May, 2023

通过 Shapley 值的分解来解释模型和特征之间的依赖关系

本文提出了一种新的算法方法，将Shapley值中两种不同的解释组合在一起，以增强模型的说明能力，并在两个真实世界的数据集上应用。

Jun, 2023

强模型的Shapley边际剩余

本研究解决了机器学习模型在解释数据生成过程（DGP）时的不足之处，尽管模型预测准确。提出的Shapley边际剩余算法通过采样可能的模型空间，提供了一种新的特征重要性度量，显著优于其他流行的特征重要性方法。研究结果表明，该算法在推断能力上具有显著优势。

Aug, 2024