可证明高效、简洁、精度高的解释

Nov, 2021

可证明高效、简洁、精度高的解释

Provably efficient, succinct, and precise explanations

Guy Blanc, Jane Lange, Li-Yang Tan

TL;DR设计了一种有效算法来解释黑盒模型的预测结果，该算法通过隐式学习决策树，满足精确度和简洁性需求，并结合全局和局部解释方法

Abstract

We consider the problem of explaining the predictions of an arbitrary blackbox model $f$: given query access to $f$ and an instance $x$, output a small set of $x$'s features that in conjunction essentially determines $f(x)$. We design an efficient algorithm with provable guarantees on

blackbox model explanation implicit learning decision trees local computation

发现论文，激发创造

通过模型提取方法解释黑匣子模型

为了解释黑盒模型，本文提出使用决策树对其进行全局解释，并采用新的决策树提取算法避免过拟合，评估表明该方法正确率更高且可解释性更强。

May, 2017

程序作为黑盒解释

本文提出了使用程序作为模型无关解释的方法，通过基于模拟退火的原型程序归纳方法，对黑匣子分类器进行本地行为的近似，生成的解释对于多个分类器具有直观性和准确性。

Nov, 2016

强健稳定的黑盒解释

通过敌对训练的方法，我们提出了一个生成稳健且高保真黑盒模型解释的新框架，尝试解决现有算法在受到分布偏移时缺乏稳定性和鲁棒性的问题，本文是首次尝试生成对一类有实际意义的敌对扰动具有鲁棒性的后续解释，实验发现我们的方法显著提高了解释的鲁棒性，而不会在原始数据分布上牺牲解释的保真度。

Nov, 2020

即使解释：正式基础、优先级和复杂性

对于可解释人工智能的半事实即使思考的局部事后解释性查询进行了研究，比较了不同类别的模型的计算复杂度，发现线性模型和基于树的模型比神经网络更具可解释性。然后引入了一种基于偏好的框架，使用户能够根据其偏好进行个性化解释，无论是在半事实还是对事实进行优化，增强了可解释性和用户中心性。最后，探索了所提出的基于偏好的框架中几个可解释性问题的复杂性，并提供了多项式情况下的算法。

Jan, 2024

概率充分解释

本研究提出了概率充分解释的理念，即通过 “足够简单” 的特征子集来 “足以” 解释分类行为，并结合可扩展的概率推理算法设计出可行的实现方案。实验证明，本算法找到的充分解释更有效，且优于基准模型 Anchors 和逻辑解释。

May, 2021

可解释的、可探究的黑匣子模型近似

提出了 BETA 框架，通过透明的逼近来解释任何黑盒分类器的行为，允许用户交互式地探索用户感兴趣的不同子空间中黑盒模型的行为。实验评估表明，与现有基线相比，该方法可以生成高度紧凑，易于理解，但准确的各种预测模型的逼近。

Jul, 2017

黑盒决策系统的本地基于规则的解释

本文提出了一种名为 LORE 的黑匣子探明方法，能够从逻辑和反事实规则两个层面解释黑匣子机器学习模型的决策原因，从而提高其在社会敏感和安全关键环境中的可用性和透明度。

May, 2018

树状可解释人工智能：从局部解释到全局理解

通过运用博弈论、局部特征交互作用效应和全局模型结构，我们实现了对基于树的机器学习模型的高可解释性，应用于三个医疗机器学习问题，在透露模型全局结构的同时保持其基本特征，识别出美国人口中高强度但低频率的非线性死亡风险因素，突显具有共同危险特征的明显人口亚组，识别出慢性肾脏疾病危险因素之间的非线性交互作用效应，并监测在医院部署的机器学习模型（Identifying factors leading to model's performance decay over time）

May, 2019

可靠的事后解释：解释性中的不确定性建模

本文提出了基于贝叶斯框架的黑盒模型解释方法，能够生成可靠的局部解释和其关联的不确定性，并且具有稳定性和高度一致性，可以快速地解决几个重要问题。通过实证研究，证明了该方法的有效性，并提高了解释的可靠性。

Aug, 2020

消除不可能，剩下的必然是真实的

研究使用背景知识使得可解释的人工智能更简洁易懂，并使用现有的规则归纳技术从数据集中提取背景信息来做出预测并报告使用的背景信息，帮助人类检查解释的正确性。

Jun, 2022