LIPEx -- 局部可解释性概率解释 -- 超越真实类别

Oct, 2023

LIPEx -- 局部可解释性概率解释 -- 超越真实类别

LIPEx -- Locally Interpretable Probabilistic Explanations -- To Look Beyond The True Class

Hongbo Zhu, Angelo Cangelosi, Procheta Sen, Anirbit Mukherjee

TL;DR本研究介绍了一种新型的基于扰动的多类别解释框架 LIPEx（局部可解释的概率解释），证明 LIPEx 不仅可以局部复制广泛使用的复杂分类模型输出的概率分布，而且还可以提供关于每个被认为重要的特征如何影响每个可能类别的预测概率的见解。研究通过根据概率分布空间中的 Hellinger 距离执行的回归获得解释的矩阵。对文本和图像数据进行的消融测试表明，与其他基于显著性或特征重要性的 XAI 方法相比，LIPEx 指导下从数据中移除重要特征会对底层模型的预测产生更大的变化。研究还表明，与 LIME 相比，LIPEx 在可靠评估解释所需的扰动数量上具有更高的数据效率。

Abstract

In this work, we instantiate a novel perturbation-based multi-class explanation framework, lipex (Locally Interpretable Probabilistic Expl

lipex perturbation-based explanation framework probability distributions feature importance

发现论文，激发创造

LIME 模型在文本分类中解释结果的稳定性分析：对抗扰动的探究

本文验证了先前文献指出的 LIME 对于无序数据稳定性较低的趋势，并在文本数据上探索了 LIME 的稳定性。

May, 2023

基于 Kullback-Leibler 投影的贝叶斯预测模型的本地可解释性模型无关解释

该研究提出了一种名为 KL-LIME 的新方法，将 Bayesian 预测模型的信息局部投影到一个简单的解释模型中，以解释 MNIST 手写数字分类结果。该方法结合了 LIME 和贝叶斯预测变量选择方法的思想，并在解释的保真度和复杂度之间找到了平衡。

Oct, 2018

基于局部不变学习的本地不变解释：实现稳定单向解释

提出了一种基于不变风险最小化 (IRM) 原则的模型无关局部解释方法，该方法能够稳定、直观地生成高保真度解释，该方法通过消除黑盒函数梯度在附近范围内突然变化的特征，实现了与实际邻居方法相当甚至更好的解释质量，同时没有必要花费过多时间来学习邻居结构。

Jan, 2022

机器学习模型的本地可解释模型无关 Shap 解释

提出了一种称为 LIMASE 的局部可解释模型无关 Shap 说明法，该方法使用 Shapley 值来解释任何模型的预测，提供局部和全局可解释的解释，解决子模块优化问题，为地区解释带来见解，并在与内核解释器相比计算更快。

Oct, 2022

为什么我应该信任你？": 解释任何分类器的预测

本文提出了一种可解释性的机器学习算法解释技术 ——LIME，基于该技术可以在一个可解释且可靠的小规模模型内对任何分类器的预测进行解释，从而提高了可信度和可理解性，实现了对于信任度的估计及诸多信任场景的适用性。

Feb, 2016

机器学习模型中的统一解释：一种扰动方法

面向可解释人工智能（XAI）的高速范式转变已在近年来出现。高度复杂的机器学习（ML）模型在许多智能任务中蓬勃发展，而问题开始从传统的有效性度量转向更深层次的问题：该模型告诉我关于我的数据什么，它是如何得出这些结论的？XAI 和建模技术之间的不一致可能对这些解释性方法的效力产生质疑。为了解决这些问题，我们提出了一种针对流行的 XAI 的模型不可知方法 SHapley Additive exPlanations（Shap）进行系统的扰动分析。我们设计了一些算法，在动态推理的设置下生成相对特征重要性，这些设置针对一套流行的机器学习和深度学习方法，以及允许我们量化静态情况下生成解释的质量的度量指标。我们提出了特征重要性方法论的分类体系，度量了一致性，并观察了几个数据集中解释模型之间的可量化相似性。

May, 2024

超越 LIME 的替代预测解释

本文提出一种算法框架 bLIMEy，用于构建定制的本地替代解释器，其中包括 LIME，该框架独立且可互操作，并讨论了组件选择对结果解释器功能能力的影响。

Oct, 2019

黑匣子 NLP 模型的解释：一项调查

本文提出了一种基于中心极限定理的假设检验框架以确定所需扰动点的数量，从而保障解释稳定性的方法 S-LIME，以解决黑箱模型的可解释性问题。对模拟数据集和实际数据集进行的实验表明了该方法的有效性。

Mar, 2022

针对 NLP 模型的最优健壮性解释保证

本文提出了基于绑架式解释的机器学习方法，为自然语言处理中的神经网络模型计算局部解释。根据用户定义的代价函数，例如解释长度，优化词汇子集以满足两个主要特征。同时在嵌入空间中确保预测不变性，该方法通过内隐命中集和最大通用子集两种解法得出结果，并可以配置不同的扰动集来检测预测结果的偏见，提高 NLP 解释框架的效果。最后，文章在 SST、Twitter 和 IMDB 数据集上对三种常用情感分析任务进行了评估，并展示了该框架的有效性。

May, 2021

模型无关 NLP 可解释性中解释的粒度

通过对复杂的基于 BERT 的分类器使用基于段落的方法，本文改进了当前基于单词采样的黑盒 NLP 可解释性方法的局限性，大大提高了基准分类任务的解释保真度。

Dec, 2020