贝叶斯分层模型用于反事实估计

Jan, 2023

Bayesian Hierarchical Models for Counterfactual Estimation

Natraj Raman, Daniele Magazzeni, Sameena Shah

TL;DR本文提出一个新的概率模型，用于计算模型的多个对抗性解释。该模型可以共享群体分组的信息，并保留领域特定的约束条件，同时评估不确定性，并得出合理、稀疏、多样和可行的结果。

Abstract

counterfactual explanations utilize feature perturbations to analyze the outcome of an original decision and recommend an actionable recourse. We argue that it is beneficial to provide several alternative explanations rather than a single point solution and propose a →

counterfactual explanations probabilistic paradigm bayesian hierarchical modeling inductive biases uncertainty quantification

发现论文，激发创造

在不确定性下对反事实干预进行估计

通过采用贝叶斯层级模型来建模不确定性，本文解决了连续设置中对反事实分布的模棱两可性问题，特别是在贝叶斯变形高斯过程中，允许非高斯分布和非加法噪声，成功应用于一个合成和半合成的案例，并展示了在算法补救下游任务中的性能。

Sep, 2023

基于梯度的可解释的可计数因果解释方法，使用可管理的概率模型

本文提出用基于概率模型的渐变计算来解决机器学习模型中反事实样例解释的问题，并通过实验证据证明该方法的优越性。

May, 2022

通过不同的反事实解释解释机器学习分类器

本文提出了一种基于决定点过程的生成和评估多样性反事实解释的框架，旨在优化反事实行为的可行性和多样性，并提供了可比较的度量标准来评估反事实方法。通过实验，验证了该框架能生成多样性的反事实，并且能有效地近似本地决策边界。

May, 2019

对策说明的随机优化

通过提出一种基于随机学习的框架和特征选择模块来平衡反事实解释的权衡，本研究在生成可行的反事实解释方面展现了其有效性，并表明其比基线更加多样化和高效。

Sep, 2022

针对反事实解释的条件生成模型

该论文提出了一种生成利用条件生成模型来生成稀疏的、在分布中反事实模型解释的通用框架，可适用于不同模态的数据，并说明了该方法在图像、时间序列和混合类型表格数据上的有效性。

Jan, 2021

针对表格数据的学习模型无关反事实解释

本文提出了一种新的方法 ——C-CHVAE，该方法可以生成可实现的反事实解释，以更好地满足反事实解释的质量要求。

Oct, 2019

变分因果推断

提出了一种基于深度变分贝叶斯框架的新方法，利用个体特征和与受试者类似的人对处理结果分布的信息来估计个体在反事实处理下的结果。

Sep, 2022

由一组解释器产生的反事实集合中选择解释的多标准方法

基于多标准分析的多阶段集成方法能够从 Pareto 前沿中选择一个用于解释机器学习模型预测的可行对策。实验结果表明，该方法能够生成具有吸引力的多种质量度量的可操作对策。

Mar, 2024

基于概率因果模型的高保真图像反事实

本研究提出了一种通用的因果生成建模框架，用于准确估计具有深度结构因果模型的高保真图像反事实情况。

Jun, 2023

反事实解释可被操纵

本文介绍了反事实解释的脆弱性并表明其容易被操纵，进一步提出了一个新颖的目标来训练明显公平的模型，在轻微扰动下反事实解释可以找到更低成本的救济措施。然而，我们在贷款和暴力犯罪预测数据集上的实验表明，这些模型可能会不公平地提供低成本的救济措施给特定的子群体。这些发现引起了对当前反事实解释技术可信度的担忧，并希望能启发对健壮性反事实解释的探索。

Jun, 2021