基于局部不变学习的本地不变解释：实现稳定单向解释

Jan, 2022

基于局部不变学习的本地不变解释：实现稳定单向解释

Locally Invariant Explanations: Towards Stable and Unidirectional Explanations through Local Invariant Learning

Amit Dhurandhar, Karthikeyan Ramamurthy, Kartik Ahuja, Vijay Arya

TL;DR提出了一种基于不变风险最小化 (IRM) 原则的模型无关局部解释方法，该方法能够稳定、直观地生成高保真度解释，该方法通过消除黑盒函数梯度在附近范围内突然变化的特征，实现了与实际邻居方法相当甚至更好的解释质量，同时没有必要花费过多时间来学习邻居结构。

Abstract

locally interpretable model agnostic explanations (LIME) method is one of the most popular methods used to explain black-box models at a per example level. Although many variants have been proposed, few provide a

locally interpretable model agnostic explanations invariant risk minimization black-box models feature attribution local decision

发现论文，激发创造

GLIME: 通用、稳定和本地的 LIME 解释

解释黑盒机器学习模型的预测的方法 LIME 存在随机种子不稳定和局部准确率低的问题，通过引入增强框架 GLIME 解决了这些挑战，提供了相对稳定且拥有更高局部准确率的解释。

Nov, 2023

DLIME：基于确定性的本地可解释模型无关解释方法应用于计算机辅助诊断系统

提出了确定性局部可解释的模型无关解释技术 (DLIME) 来解决 LIME 技术中由于随机扰动和特征选择方法导致的解释生成不稳定的问题，在三个不同的医疗数据集上实验表明 DLIME 相比 LIME 具有更好的稳定性，这对于在医学 CAD 系统中的部署非常重要。

Jun, 2019

OptiLIME: 优化的 LIME 算法解释 —— 针对诊断计算算法

本文介绍了一种用于解释任何类型的机器学习模型的流行方法：局部可解释的模型无关解释（LIME）。该方法通过学习围绕预测的简单线性模型来解释一个预测，但其主要缺点是不稳定性。论文提出了一个称为 OptiLIME 的框架，以最大化稳定性，同时保留预定义水平的粘附性，并且对所得到的解释的数学属性进行了明确的突出显示。

Jun, 2020

LIME 模型在文本分类中解释结果的稳定性分析：对抗扰动的探究

本文验证了先前文献指出的 LIME 对于无序数据稳定性较低的趋势，并在文本数据上探索了 LIME 的稳定性。

May, 2023

S-LIME: 模型解释的稳定化 LIME

研究黑盒机器学习模型的解释方法，提出一种基于中心极限定理的假设测试框架方法，名为 S-LIME，以保证解释结果的稳定性，实验结果在模拟和真实数据集上表明该方法的有效性。

Jun, 2021

解释解释器：LIME 的首个理论分析

该文提供了 LIME 算法的首个理论分析，当函数为线性函数时，我们为可解释模型的系数导出了闭式表达式，其中这些系数与被解释函数的梯度成正比，但分析也揭示了 LIME 在选择参数不当时可能会错过重要的特征。

Jan, 2020

超越 LIME 的替代预测解释

本文提出一种算法框架 bLIMEy，用于构建定制的本地替代解释器，其中包括 LIME，该框架独立且可互操作，并讨论了组件选择对结果解释器功能能力的影响。

Oct, 2019

机器学习模型的本地可解释模型无关 Shap 解释

提出了一种称为 LIMASE 的局部可解释模型无关 Shap 说明法，该方法使用 Shapley 值来解释任何模型的预测，提供局部和全局可解释的解释，解决子模块优化问题，为地区解释带来见解，并在与内核解释器相比计算更快。

Oct, 2022

ALIME: 基于自编码器的局部可解释性方法

本文提出了一种改进的可解释深度学习模型的方法，通过使用自动编码器来加权，从而提高了 LIME 的稳定性和本地保真度。

Sep, 2019

基于 Kullback-Leibler 投影的贝叶斯预测模型的本地可解释性模型无关解释

该研究提出了一种名为 KL-LIME 的新方法，将 Bayesian 预测模型的信息局部投影到一个简单的解释模型中，以解释 MNIST 手写数字分类结果。该方法结合了 LIME 和贝叶斯预测变量选择方法的思想，并在解释的保真度和复杂度之间找到了平衡。

Oct, 2018