Jan, 2023
贝叶斯分层模型用于反事实估计
Bayesian Hierarchical Models for Counterfactual Estimation
Natraj Raman, Daniele Magazzeni, Sameena Shah
TL;DR本文提出一个新的概率模型,用于计算模型的多个对抗性解释。该模型可以共享群体分组的信息,并保留领域特定的约束条件,同时评估不确定性,并得出合理、稀疏、多样和可行的结果。
Abstract
counterfactual explanations utilize feature perturbations to analyze the
outcome of an original decision and recommend an actionable recourse. We argue
that it is beneficial to provide several alternative explanations rather than a
single point solution and propose a →
counterfactual explanationsprobabilistic paradigmbayesian hierarchical modelinginductive biasesuncertainty quantification
发现论文,激发创造
在不确定性下对反事实干预进行估计
通过采用贝叶斯层级模型来建模不确定性,本文解决了连续设置中对反事实分布的模棱两可性问题,特别是在贝叶斯变形高斯过程中,允许非高斯分布和非加法噪声,成功应用于一个合成和半合成的案例,并展示了在算法补救下游任务中的性能。
Sep, 2023
通过不同的反事实解释解释机器学习分类器
本文提出了一种基于决定点过程的生成和评估多样性反事实解释的框架,旨在优化反事实行为的可行性和多样性,并提供了可比较的度量标准来评估反事实方法。通过实验,验证了该框架能生成多样性的反事实,并且能有效地近似本地决策边界。
May, 2019
针对反事实解释的条件生成模型
该论文提出了一种生成利用条件生成模型来生成稀疏的、在分布中反事实模型解释的通用框架,可适用于不同模态的数据,并说明了该方法在图像、时间序列和混合类型表格数据上的有效性。
Jan, 2021
由一组解释器产生的反事实集合中选择解释的多标准方法
基于多标准分析的多阶段集成方法能够从 Pareto 前沿中选择一个用于解释机器学习模型预测的可行对策。实验结果表明,该方法能够生成具有吸引力的多种质量度量的可操作对策。
Mar, 2024
反事实解释可被操纵
本文介绍了反事实解释的脆弱性并表明其容易被操纵,进一步提出了一个新颖的目标来训练明显公平的模型,在轻微扰动下反事实解释可以找到更低成本的救济措施。然而,我们在贷款和暴力犯罪预测数据集上的实验表明,这些模型可能会不公平地提供低成本的救济措施给特定的子群体。这些发现引起了对当前反事实解释技术可信度的担忧,并希望能启发对健壮性反事实解释的探索。
Jun, 2021