T-COL: 生成变量机器学习系统一般用户偏好的反事实解释

Sep, 2023

T-COL: 生成变量机器学习系统一般用户偏好的反事实解释

T-COL: Generating Counterfactual Explanations for General User Preferences on Variable Machine Learning Systems

Ming Wang, Daling Wang, Wenfang Wu, Shi Feng, Yifei Zhang

TL;DR机器学习领域中存在无法解释的问题，通过引入可行的建议并解释为什么产生特定结果的对抗性解释（CEs）被提出。我们提出了几种被用户研究验证的常规用户喜好，并将其映射到 CEs 的特性，同时引入了一种名为 T-COL 的新方法，该方法在生成适应常规用户喜好的 CEs 的同时，能够在替换 ML 模型时生成更加稳健和有效的 CEs。经过实验证明，与基准方法包括大型语言模型相比，T-COL 更适用于适应用户喜好和变量 ML 模型。

Abstract

machine learning (ML) based systems have been suffering a lack of interpretability. To address this problem, counterfactual explanations (CEs) have been proposed. CEs are unique as they provide workable suggestio

machine learning counterfactual explanations user preferences ml models t-col

发现论文，激发创造

基于用户反馈的反事实解释介绍 (UFCE)

本研究引入了一种新的方法论，名为用户反馈式反事实解释（UFCE），以解决当前反事实解释算法的局限性，并旨在提高对提供的解释的置信度。实验证明，UFCE 在接近度、稀疏度和可行性方面胜过两种著名的 CE 方法，并指出用户约束对生成可行的反事实解释具有影响。

Feb, 2024

机器学习中的鲁棒反事实解释：一项调查

对于机器学习模型的预测结果影响的人来说，反事实解释（CEs）被认为是提供理想算法解决方案的。然而，最近的工作揭示了与获取 CEs 的最新方法相关的严重问题的存在，因此需要采取技术来减轻风险。在这项调查中，我们回顾了快速发展的稳健 CEs 领域的研究，并对其所考虑的稳健性形式进行了深入分析。我们还讨论了现有解决方案及其限制，为未来的发展提供了坚实的基础。

Feb, 2024

通过隐式最小化认识和随机不确定性来生成可解释的反事实解释

提出了一种简单快速的生成可解释反事实解释的方法，无需辅助模型，使用分类器的预测不确定性，在 IM1 得分方面比现有方法生成更可解释的 CEs。此外，该方法还允许估计 CE 的不确定性，这在医疗等安全关键应用中可能非常重要。

Mar, 2021

CoLa-DCE -- 概念引导的潜在扩散对抗性解释

通过 Concept-guided Latent Diffusion Counterfactual Explanations (CoLa-DCE) 方法生成概念导向的反事实解释，提供更高的控制度和更好的可理解性，以及对模型错误的帮助。

Jun, 2024

通过潜在空间的解缠释义实现回归

本文提出了一种新的方法，通过首先将潜空间中的标签无关特征与预定义的输出相结合，以为预先训练的回归器生成对立解释。通过在潜空间中搜索，我们展示了该方法在回归问题设置下重要高维机器学习应用中具有竞争力。

Nov, 2023

高斯混合分布潜在空间中的反事实解释搜索

通过改进自动编码器的潜空间生成方法，该论文介绍了一种新的生成反事实解释的方法，该方法在保持输入样本特征的同时能有效地返回更接近原始数据的结果，适用于高维机器学习应用。

Jul, 2023

针对数据转换下的反事实解释鲁棒性的验证训练

这篇论文介绍了 VeriTraCER，一种联合训练分类器和解释器的方法，明确考虑生成的反事实解释对小型模型偏移的稳健性，从而提供对反事实解释有效性的确定性保证。我们的实证评估表明，VeriTraCER 生成的反事实解释 (1) 对小型模型更新具有可验证的稳健性，(2) 在处理包括随机初始化、leave-one-out 和分布偏移等经验模型更新方面显示出与最先进方法竞争力的稳健性。

Mar, 2024

超越一刀切：将反事实解释适应用户目标

解释性人工智能 (XAI) 是一项关键研究领域，旨在增强人工智能系统的透明度和解释性。反事实解释 (CFEs) 通过探索某些因素不同的替代情景，为机器学习算法的决策过程提供有价值的洞察。本文主张细致理解 CFEs，了解用户目标和目标应用的多样化需求，以设计更有效且量身定制的解释，以满足用户的特定需求，从而提高与人工智能系统的协作。

Apr, 2024

计算反事实解释的方法 —— 一项调查研究

机器学习模型日益广泛应用，因此解释其预测和行为变得越来越重要。本文综述了针对多种不同机器学习模型高效计算对抗性解释的模型特定方法，并提出了文献中尚未考虑的模型方法。

Nov, 2019

线性优化的反事实解释

探究了对复杂 AI 系统内部工作方式的理解中产生的反事实解释（CE）概念，并将 CE 的思想转化为线性优化，提出、激发、并分析了三种不同类型的 CE：强 CE、弱 CE 和相对 CE。通过检测和利用后一种情况下产生的优化问题的隐藏凸结构，证明计算相对 CE 的效率高。通过对 NETLIB 库进行广泛的数值实验研究，证实了获得相对 CE 可以在与解决原始线性优化问题相同数量级的时间内完成。

May, 2024