多目标反事实解释

Apr, 2020

Multi-Objective Counterfactual Explanations

Susanne Dandl, Christoph Molnar, Martin Binder, Bernd Bischl

TL;DR该研究提出了一种多目标反事实解释方法（MOC），将反事实搜索转化为多目标优化问题，通过对特征空间的多样性维护，返回一组不同权衡的反事实，并在实际案例中展示了 MOC 的有用性和与现有方法的对比。

Abstract

counterfactual explanations are one of the most popular methods to make predictions of black box machine learning models interpretable by providing explanations in the form of `what-if scenarios'. Most current ap

counterfactual explanations machine learning multi-objective optimization post-hoc analysis model-agnostic

发现论文，激发创造

由一组解释器产生的反事实集合中选择解释的多标准方法

基于多标准分析的多阶段集成方法能够从 Pareto 前沿中选择一个用于解释机器学习模型预测的可行对策。实验结果表明，该方法能够生成具有吸引力的多种质量度量的可操作对策。

Mar, 2024

通过数学优化在基于得分的分类中生成集体反事实解释

利用数学优化模型，通过集体反事实解释为给定组内各实例提供一个反事实解释，以使扰动实例的总成本在一定约束下最小化，从而检测对整个数据集都至关重要的特征，验证了该方法的实用性。

Oct, 2023

对策说明的随机优化

通过提出一种基于随机学习的框架和特征选择模块来平衡反事实解释的权衡，本研究在生成可行的反事实解释方面展现了其有效性，并表明其比基线更加多样化和高效。

Sep, 2022

使用多目标优化探索反事实解释中的可信度、变化强度和对抗能力之间的权衡

使用多目标优化模型，通过生成逆因模型生成可信的对抗实例，以提高深度学习模型的透明度，检测偏见和数据不当的形式。

May, 2022

OCTET: 基于对象的反事实解释

本研究提出了一种以物体为中心的框架来生成反事实解释，该方法通过将查询图像编码到潜在空间中，以便在物体级别上进行操作，并且可以适用于驾驶场景的反事实解释基准测试，并且设计并运行了用户研究以衡量反事实解释在理解决策模型方面的有用性。

Nov, 2022

计算反事实解释的方法 —— 一项调查研究

机器学习模型日益广泛应用，因此解释其预测和行为变得越来越重要。本文综述了针对多种不同机器学习模型高效计算对抗性解释的模型特定方法，并提出了文献中尚未考虑的模型方法。

Nov, 2019

基于梯度的可解释的可计数因果解释方法，使用可管理的概率模型

本文提出用基于概率模型的渐变计算来解决机器学习模型中反事实样例解释的问题，并通过实验证据证明该方法的优越性。

May, 2022

MACE：一个高效的模型无关框架用于因果解释

提出了一种新的框架 Model-Agnostic Counterfactual Explanation (MACE)，通过采用一种新设计的流水线来有效处理大量特征值上的非可分机器学习模型，其中包括使用基于 RL 的方法来找到良好的对策例子和梯度下降方法来改进相似性。公共数据集上的实验证实了该方法的有效性，具有更好的准确性、稀疏性和相似性。

May, 2022

有关重大决策的通用反事实解释模型

该研究提出了一种基于形式验证的算法，使用逻辑公式表示距离函数（目标）和预测模型（约束），解决满足性问题生成最接近的反事实解释，能够生成可行的多样化反事实解释来满足 100% 的覆盖率。

May, 2019

决策、反事实解释与战略行为

本文旨在在战略环境下寻找最优的政策和对策解释，包括 NP 难的问题，非降性和子模性，用标准贪心算法获得近似保证。最后，我们表明通过将拟阵约束加入问题的制定中，我们可以提高对策解释的最优集合的多样性，并激励整个人口谱上的个体自我改进。

Feb, 2020