算法补救：从反事实解释到干预

Feb, 2020

Algorithmic Recourse: from Counterfactual Explanations to Interventions

Amir-Hossein Karimi, Bernhard Schölkopf, Isabel Valera

TL;DR本研究旨在基于因果推理，强调针对机器学习的偏见或错误决策，我们应该将注意力从解释数据的方式转向提供介绍、通过最小干预实现推荐的方式，以获得更好的结果。

Abstract

As machine learning is increasingly used to inform consequential decision-making (e.g., pre-trial bail and loan approval), it becomes important to explain how the system arrived at its decision, and also suggest actions to achieve a favorable decision. →

machine learning counterfactual explanations causal reasoning recourse minimal interventions

发现论文，激发创造

机器学习的反事实解释和算法补救措施综述

本文综述分类了反事实解释的研究，包括如何评估和设计反事实解释算法，探讨了反事实解释在机器学习领域中的研究方向和发现的不足之处。

Oct, 2020

局部引导的顺序算法补救的反事实解释

通过算法补偿实施的反事实推演已成为使人工智能系统具有可解释性的强大工具，本文提出了一种名为 LocalFACE 的模型不可知技术，通过局部获取的信息在每个算法补偿步骤中构建可行且可操作的反事实解释。

Sep, 2023

计算反事实解释的方法 —— 一项调查研究

机器学习模型日益广泛应用，因此解释其预测和行为变得越来越重要。本文综述了针对多种不同机器学习模型高效计算对抗性解释的模型特定方法，并提出了文献中尚未考虑的模型方法。

Nov, 2019

反事实解释可被操纵

本文介绍了反事实解释的脆弱性并表明其容易被操纵，进一步提出了一个新颖的目标来训练明显公平的模型，在轻微扰动下反事实解释可以找到更低成本的救济措施。然而，我们在贷款和暴力犯罪预测数据集上的实验表明，这些模型可能会不公平地提供低成本的救济措施给特定的子群体。这些发现引起了对当前反事实解释技术可信度的担忧，并希望能启发对健壮性反事实解释的探索。

Jun, 2021

走向非对抗性算法修复

在高风险情况下，通过对敌对示例和反事实解释的形式定义，我们介绍了非敌对算法性回应，并阐明了为什么在获得不具备敌对特性的反事实解释方面是至关重要的。我们进一步研究了目标函数中不同组件（例如用于计量距离的机器学习模型或成本函数）如何决定结果是否可以被视为敌对示例。我们对常见数据集进行的实验证明，这些设计选择通常比使用回应或攻击算法更关键，以决定回应是否具有非敌对特性。此外，我们展示了选择强大和准确的机器学习模型会导致实践中所期望的更少敌对性回应。

Mar, 2024

黑盒决策系统中逼近真实个体补救和可操作解释

我们提出了一种基于机器学习的回溯算法，用于提供决策结果不理想的人可以采取的可操作的一系列改变，以改善他们的结果。我们的算法可适用于各个不同 iable 的基于机器学习的决策系统，并填补了关于公平性的现有文献的不足之处。

Jul, 2019

强化学习的反事实解释

通过重新定义反事实解释方法，结合强化学习的特点，探索在强化学习领域实现反事实解释的方法和研究方向。

Oct, 2022

不完善因果知识下的算法补救：一种概率方法

通过两种概率方法选取最优行动以在有限的因果知识下实现补救，以解决缺乏真实结构因果模型的限制，并在不完美的因果知识下提供比非概率基线更可靠的建议。

Jun, 2020

决策、反事实解释与战略行为

本文旨在在战略环境下寻找最优的政策和对策解释，包括 NP 难的问题，非降性和子模性，用标准贪心算法获得近似保证。最后，我们表明通过将拟阵约束加入问题的制定中，我们可以提高对策解释的最优集合的多样性，并激励整个人口谱上的个体自我改进。

Feb, 2020

对策说明的随机优化

通过提出一种基于随机学习的框架和特征选择模块来平衡反事实解释的权衡，本研究在生成可行的反事实解释方面展现了其有效性，并表明其比基线更加多样化和高效。

Sep, 2022