超越单一特征重要性的冰激凌

Jul, 2023

Beyond Single-Feature Importance with ICECREAM

Michael Oesterle, Patrick Blöbaum, Atalanti A. Mastakouri, Elke Kirschbaum

TL;DR通过识别 ICECREAM 对于任何模型中的常见和罕见事件进行基于联合的解释的研究，我们提出一种信息论定量度量来衡量变量联合对目标变量分布的影响，实验结果显示 ICECREAM 在解释性和根本原因分析方面优于其他方法，并在两个任务中取得了令人印象深刻的准确性。

Abstract

Which set of features was responsible for a certain output of a machine learning model? Which components caused the failure of a cloud computing application? These are just two examples of questions we are addressing in this work by Identifying Coalition-based →

features machine learning model cloud computing application explanations icecream

发现论文，激发创造

将尺子带入黑匣子：从个体条件期望图中揭示特征影响

本研究提出一种新的基于 ICE 图的特征影响度量，可解释为类似于线性回归系数的模型无关，性能无关的特征影响度量，并介绍了 ICF 特征影响力的多样性，最后我们展示了这种实用性工具在几个现实世界的数据任务中的效用。

Sep, 2021

自动基于概念的解释

提出了概念解释的原则和求解算法 ACE，能够系统性地通过可视化概念提供对深度神经网络预测的重要性的人类可解释性解释。

Feb, 2019

基于变分的因果识别

通过 VCEI 框架，在单个观测设置中对双变量系统进行因果发现，基于因果和机制的独立性原则，人为构造两个设置，通过核最大平均偏差将人为干预转化为一个凸优化问题，通过一系列实验表明 VCEI 方法是一种有竞争力的因果发现方法。

Nov, 2022

贝叶斯深度冰

深度独立分量估计（DICE）是一种现代机器学习中用于特征工程提取的方法，通过期望最大化（EM）和马尔可夫链蒙特卡罗（MCMC）算法，我们提供了独立分量分析的新型潜变量表示，该方法还适用于非线性特征提取的流体方法，并讨论了如何实现条件后验和基于包络的优化方法，通过这种表示层次，我们统一了许多迄今为止不相关的估计过程，在数值实例上说明了我们的方法和算法，最后，我们总结了未来研究方向。

Jun, 2024

对文本数据进行特征重要性和规则提取的可解释性比较

本文研究机器学习算法中普遍存在的可解释性方法，通过不同的解释方法应用到简单的模型中，发现不同之处并提出一种新的方法来比较不同解释间的差异。

Jul, 2022

黑盒模型特征重要性可视化

本文介绍了一种基于局部特征重要性的机器学习可解释性方法，提出了两个可视化工具：partial importance (PI) 和 individual conditional importance (ICI) plots，并引入了 Shapley feature importance，可以公平地分配模型性能，比较不同模型上的特征重要性。

Apr, 2018

机器学习中偏差引发的特征的检测与评估

该研究提出了一种系统性地识别模型中引起偏见的所有特征的方法，以帮助领域专家在决策过程中提供支持。通过评估四个知名数据集，展示了我们的贡献如何在开发、测试、维护和部署公平 / 公正的机器学习系统时推动标准程序。

Oct, 2023

特征重要性和反事实解释的鲁棒性调查

研究了金融领域中两类常用的局部解释方法的健壮性，给出了健壮性分析的分类方法和结果，并探讨了如何扩展分析方法以确定可靠的解释方法。

Oct, 2021

统一特征归属和反事实说明：不同的手段达成了相同的目的

通过真实因果关系框架提供一种将特征归因和反事实解释统一的解释方法，通过在 Adult-Income，LendingClub 和 German-Credit 三个基准数据集上的实验，发现 Feature attribution 方法和 counterfactual explanation 方法并不总是一致的，也表明了他们之间的互补性。

Nov, 2020

使用可解释的人工智能根本原因分析预测异常

该论文介绍了可解释人工智能在连续学习用户参与数据的机器学习模型中追溯性能退化的新应用。我们成功地将这种技术应用于提高个性化广告模型的可靠性。这种系统中的性能退化表现为模型中的预测异常。我们演示了全局特征重要性分布的时间漂移如何有效地隔离预测异常的原因，具有比模型对特征相关性方法更好的召回率。该技术似乎在使用简单的扰动方法来近似局部特征重要性并在几千个示例上聚合时也是有效的。我们发现这种技术是一种与模型无关、成本低廉且有效监控生产中复杂数据流水线的方法，并已部署了用于连续分析连续训练模型的全局特征重要性分布的系统。

Mar, 2024