Shapley值的因果分析:条件与边际
本文探讨了Shapley值在归因问题中的多样实现方式及产生的问题,且提出了一种基于独特性原理的技术Baseline Shapley(BShap),并将其与Integrated Gradients进行对比。
Aug, 2019
本研究提出了一个新的机器学习模型解释框架FAE(Formulate,Approximate,Explain)。该框架利用了Shapley值和博弈论方法进行解释,并提供了置信区间和对比解释来解释黑盒子模型在不同数据集上的结构。
Sep, 2019
采用博弈论方法计算机器学习模型特征重要性的数学问题存在和Shapley值并不能很好地解释人类可解释目标的论证以及需要因果推理等技术增加复杂性。
Feb, 2020
该研究论文讨论了在机器学习中解释协作游戏的Shapley值的应用,特别是在特征归因方面。作者提出了两种主要方法来连接机器学习模型和协同游戏,并讨论了如何在模型和数据之间进行选择。此外,他们提出了一个有效的方法来计算线性模型中Shapley值,并在两个实际的数据案例中研究了与特征属性相关的建模选择。
Jun, 2020
本文探讨了Shapley 值在贝叶斯网络框架下的应用,分析了Shapley 值与条件独立性的关系,并发现高Shapley值的变量不一定对模型预测性能有显著影响,而低Shapley值的变量可能会导致较差的预测结果。因此,在一般情况下,使用Shapley值进行特征选择并不一定能建立起最简单和预测性最优的模型,而且Shapley值不反映变量与目标之间的因果关系。
Aug, 2020
本文提出了一种基于因果关系的模型特征表示方法,探讨了基于屏蔽措施的归因方法的理论缺陷,证明了因果关系是 Shapley 值的基本原理,定义了最佳的基线值,并提出了一种通过学习得到最佳基线值的方法,实验结果证明了该方法的有效性。
May, 2021
本文主要研究如何使用 Monte Carlo 积分或回归来模拟条件期望值以估计 Shapley 值,以及对现有方法进行改进和系统化分类,并进行广泛的模拟和实际数据实验来评估和推荐何时使用不同的方法类。
May, 2023
本文提出了一种新的算法方法,将Shapley值中两种不同的解释组合在一起,以增强模型的说明能力,并在两个真实世界的数据集上应用。
Jun, 2023
本研究解决了机器学习模型在解释数据生成过程(DGP)时的不足之处,尽管模型预测准确。提出的Shapley边际剩余算法通过采样可能的模型空间,提供了一种新的特征重要性度量,显著优于其他流行的特征重要性方法。研究结果表明,该算法在推断能力上具有显著优势。
Aug, 2024