Aug, 2023

概率黑盒异常归因的生成扰动分析

TL;DR我们提出了一个概率异常归因框架,可以在黑盒回归情况下计算每个输入变量的归因得分的概率分布,从而解释与黑盒模型的异常偏差。我们展示了主流的模型无关解释方法在这个任务中不适用,并提出了一个新的框架,可以计算归因得分的预测均值和量化不确定性。我们介绍了一种变分贝叶斯算法,用于推导每个变量归因得分的分布。据我们所知,这是第一个不受偏差影响的概率异常归因框架。