严格的概率保证对于鲁棒的反事实解释

Jul, 2024

严格的概率保证对于鲁棒的反事实解释

Rigorous Probabilistic Guarantees for Robust Counterfactual Explanations

Luca Marzari, Francesco Leofante, Ferdinando Cicalese, Alessandro Farinelli

TL;DR我们研究了深度学习模型反事实解释的鲁棒性评估问题，并提出了一种关于此设置中鲁棒性属性的新框架，其中重点考虑了可能的模型变化。通过首次展示反事实对于可能的模型变化的鲁棒性计算是NP完全的，以此来激发我们解决方案的动机。本文提出了一种新的概率方法，能够在保持可伸缩性的同时提供鲁棒性的紧密估计和强有力的保证，与现有解决方案不同的是，我们的方法不对待分析的网络提出要求，从而使得鲁棒性分析适用于更广泛的架构。在四个二分类数据集上的实验证明，我们的方法在生成鲁棒解释方面改进了现有技术，并在各种度量指标上优于现有方法。

Abstract

We study the problem of assessing the robustness of counterfactual explanations for deep learning models. We focus on $\textit{plausible model sh

发现论文，激发创造

深度模型的一致对法推断

本篇论文研究了深度网络下，机器学习模型一致性与反事实样本的关系，在权重初始化和数据保留等初步训练条件发生微小变化时，提出了通过稳定邻近搜索算法来生成更一致解释的反事实样本的方法，并证明了该方法在多个基准数据集上具有有效性。

Oct, 2021

神经网络对抗解释的稳健性形式化

该研究提出了Delta-robustness概念，基于区间神经网络的抽象框架，确定性地评估了神经网络中CFX的健壮性，并表明了它在提高可靠性方面的应用。

Aug, 2022

生成强健的反事实解释

本文提出了一种名为CROCO的新框架，用于生成具有鲁棒性的反事实解释，并有效地管理反事实输入更改带来的挑战，针对表格数据进行评估，证明了该方法的有效性。

Apr, 2023

带有概率保证的神经网络的鲁棒的反事实解释

通过引入“自然发生的模型变化”这种数学抽象概念，提出了一种能度量不同模型下反事实解释的鲁棒性的度量标准，该标准称为“稳定性”，并证明了当该度量标准足够高时，针对高斯函数的稳定性也足够高，能够有效解决不同模型之间的反事实解释一致性问题。

May, 2023

通过鲁棒优化为神经网络提供可证明稳健和可信的反事实解释

使用鲁棒优化技术，我们提出了Provably RObust and PLAusible Counterfactual Explanations (PROPLACE)方法来解决现有工作中的局限性，并通过比较实验证明其在三个评估方面的性能达到了最先进水平。

Sep, 2023

通过多样性促进反事实鲁棒性

通过报告多个反事实，可以提供一些有意义的鲁棒性保证，这篇论文提出了一种近似算法来选择最相关的解释，并在实验中证明了其在生成鲁棒性解释方面的改进。

Dec, 2023

机器学习中的鲁棒反事实解释：一项调查

对于机器学习模型的预测结果影响的人来说，反事实解释（CEs）被认为是提供理想算法解决方案的。然而，最近的工作揭示了与获取CEs的最新方法相关的严重问题的存在，因此需要采取技术来减轻风险。在这项调查中，我们回顾了快速发展的稳健CEs领域的研究，并对其所考虑的稳健性形式进行了深入分析。我们还讨论了现有解决方案及其限制，为未来的发展提供了坚实的基础。

Feb, 2024

鲁棒的反事实解释的间隔抽象

为了解决因模型变动导致已有方法无效的问题，我们提出了一种用于参数化机器学习模型的新颖区间抽象技术，能够获得可靠的对抗模型变动的证明，进而提供具备可证明健壮性的反事实解释。通过基于混合整数线性规划的验证程序，我们进一步提出了两种算法，生成具备对抗模型变动健壮性的反事实解释，并通过对比实证研究表明，我们的算法在寻找具备健壮性的反事实解释方面具有很好的效果。

Apr, 2024

鲁棒反事实解释中的一般模型变化

随着算法决策对人类生活的影响越来越大，模型的可解释性已成为机器学习中的关键问题。对抗解释是可解释机器学习领域的重要方法，它不仅有助于用户理解机器学习模型为何做出特定决策，还可以帮助用户理解如何改变这些决策。本文提出了自然发生的模型改变的更一般概念——模型参数改变，并证明了相应的概率保证。此外，我们还考虑了一种更具体的问题——数据集扰动，并通过优化理论给出了相关的理论结果。

Jul, 2024

具有模型变化鲁棒性概率保证的反事实解释

本研究解决了现有反事实解释（CFE）在面对模型变化时失效的问题。提出了一种新颖的方法，通过理论框架定义鲁棒性，确保CFE在任何模型和变化类型上的概率保证，并通过BetaRCE方法增强了解释质量。实验表明，BetaRCE生成的反事实解释在鲁棒性和 plausibility 上均优于基线方法。

Aug, 2024