IJCAIJun, 2024

分析训练样本对解释的影响

TL;DR通过解释 AI 系统的决策,例如提供达到子程序目标的反事实解释,来分析 AI 系统的推理是一种流行的可解释 AI(XAI)方法。本文提出了一个新问题,即识别对给定解释(或相关量)有很高影响力的训练数据样本,并研究了受保护群体之间子程序成本差异的特定情况。我们提出了一种算法来识别这样的有影响力的训练样本。