能否忠实地表示缺失状态以计算DNN中的Shapley值?
本研究提出了一个新的机器学习模型解释框架FAE(Formulate,Approximate,Explain)。该框架利用了Shapley值和博弈论方法进行解释,并提供了置信区间和对比解释来解释黑盒子模型在不同数据集上的结构。
Sep, 2019
本文探讨了Shapley 值在贝叶斯网络框架下的应用,分析了Shapley 值与条件独立性的关系,并发现高Shapley值的变量不一定对模型预测性能有显著影响,而低Shapley值的变量可能会导致较差的预测结果。因此,在一般情况下,使用Shapley值进行特征选择并不一定能建立起最简单和预测性最优的模型,而且Shapley值不反映变量与目标之间的因果关系。
Aug, 2020
本论文提出了一种基于多线性扩展技术的新采样方法来估计Shapley值,可用于任何机器学习模型,特别是多类分类或回归问题。通过对两个数据集的实验,我们证明了该方法通过减少采样统计变量的方差来提供更准确的Shapley值估计。
Oct, 2020
本文探讨了如何通过线性回归来有效估计机器学习模型的Shapley值,并提出了一种方差缩减技术,以加速两个估计器的收敛速度。此外,还发现了一种新的无偏版本KernelSHAP,并提出了一种针对随机合作博弈的方法,可产生两个全局解释方法的快速新估计器。
Dec, 2020
本文介绍了合作博弈理论的基本概念以及Shapley value的公理性质,概述了其在机器学习中的最重要应用:特征选择,可解释性,多智能体强化学习,集成修剪和数据估价,指出了Shapley value的主要局限性和未来研究方向。
Feb, 2022
本文主要研究如何使用 Monte Carlo 积分或回归来模拟条件期望值以估计 Shapley 值,以及对现有方法进行改进和系统化分类,并进行广泛的模拟和实际数据实验来评估和推荐何时使用不同的方法类。
May, 2023
本文提出了一种新的算法方法,将Shapley值中两种不同的解释组合在一起,以增强模型的说明能力,并在两个真实世界的数据集上应用。
Jun, 2023
本研究聚焦于Shapley值的计算方法,特别是条件方法和边际方法在特征相关情况下导致的不一致结果。提出了通过因果论证解决这一争议的新颖方法,发现条件方法在因果角度上存在根本性缺陷,并推论出边际方法应优于条件方法。该研究为合理选择Shapley值计算方法提供了理论基础,具有重要的实用价值。
Sep, 2024
本研究解决了Shapley值在机器学习特征归因及数据估值中的局限性,通过引入Shapley交互(SIs)为实体群体分配联合贡献,提升对黑箱模型的理解。我们提出的shapiq是一个开源Python包,整合了最先进的算法,能够高效计算Shapley值和任意阶的SIs,并提供了基准测试工具,以系统性评估其在多种机器学习应用中的性能。
Oct, 2024