利用反事实分析解释模型确信度

AAAIMar, 2023

Explaining Model Confidence Using Counterfactuals

Thao Le, Tim Miller, Ronal Singh, Liz Sonenberg

TL;DR本文探究面向人工智能交互中置信度得分的反事实解释如何增强人对机器学习模型预测的理解和信任，并提出了两种理解置信度得分的方法，即基于反事实案例和基于反事实空间可视化，这两种方法可以相互补充，但也存在异同，因此需要进一步研究和设计更加精准有效的解释方法和应用场景。

Abstract

Displaying confidence scores in human-ai interaction has been shown to help build trust between humans and AI systems. However, most existing research uses only the →

human-ai interaction confidence score counterfactual explanation machine learning model trust

发现论文，激发创造

使用反事实解释模型置信度提升模型理解和信任

本文阐述了反事实解释信心分数是如何帮助用户更好地理解和更好地信任 AI 模型的预测，在人机交互系统中展示信心分数可以帮助建立人类和 AI 系统之间的信任，提出了两种用于理解模型信心的方法：(1) 基于反事实例；和 (2) 基于反事实空间的可视化。

Jun, 2022

理解反事实解释对人工智能辅助临床决策中信任与依赖的影响

通过使用显著特征解释和假设性解释来更加分析性地对待人工智能建议，可以降低对人工智能的过度依赖，提高医疗决策过程中的性能和一致性，尤其是在确保人工智能提供正确输出的情况下。

Aug, 2023

计算反事实解释的方法 —— 一项调查研究

机器学习模型日益广泛应用，因此解释其预测和行为变得越来越重要。本文综述了针对多种不同机器学习模型高效计算对抗性解释的模型特定方法，并提出了文献中尚未考虑的模型方法。

Nov, 2019

AI 辅助决策中置信度和解释对准确性和信任校准的影响

研究了基于不同特征的人工智能辅助决策场景下，人类对人工智能的信任度与信任度校正，以及人类与人工智能协同工作的影响因素。结果表明，人类信任度的校正能够通过特定的置信度得到有效提高，尽管人类的专业独特知识对于决策的最终结果有良好的辅助作用，但同时也存在着使用本地解释会出现的问题。因此，我们需要探索新的可信度解释方法来更好地衡量和校正人类对人工智能的信任度。

Jan, 2020

AI 系统的反事实解释是否会扭曲普通用户对世界因果直觉的理解？如果是，我们能纠正吗？

本文探讨了 AI 系统中基于反事实进行的解释在实际应用中所带来的影响以及其引发的因果信念变化，通过实验证明了提供 AI 系统预测的反事实解释会影响人们对于该预测所关联的特征是否具有因果性的判断，其结果表明指出 AI 系统只能捕捉到相关关系而非因果关系可以减轻其影响。

May, 2022

CERTIFAI：人工智能模型鲁棒性、透明度、可解释性和公平性的因果推断解释

本文介绍了一个通用工具 CERTIFAI，可以应用于任何黑盒模型和任何类型的输入数据，通过生产接近输入但改变模型预测的 counterfactuals，探讨机器学习模型的鲁棒性、可解释性、透明性和公平性，并介绍了第一个黑盒模型鲁棒性分数 CERScore。

May, 2019

人工智能中的归因分数和因果反事实解释

本文介绍了解释在人工智能中的重要性，特别是解释方法的新发展。通过讨论基于属性分数和因果关系的反事实解释法，强调了逻辑推理在处理反事实时的重要性和其对评分计算的作用。

Mar, 2023

对策说明的随机优化

通过提出一种基于随机学习的框架和特征选择模块来平衡反事实解释的权衡，本研究在生成可行的反事实解释方面展现了其有效性，并表明其比基线更加多样化和高效。

Sep, 2022

揭示反事实解释在就业能力的潜力

本研究提出反事实解释在复杂机器学习算法下的应用，以数据实例展示其在雇用相关问题中提高决策支持、遵守法律要求、引导受控变更和分析新颖洞见的作用。

May, 2023

可解释的信贷申请预测与反事实解释

使用黑盒子分类器预测信用申请，使用反事实解释单个预测。通过 HELOC 贷款应用数据集的实验表明，我们的贡献优于基线对策生成策略，导致更小更易于解释的反事实。

Nov, 2018