Oct, 2023

基于样本的通用表示器的解释

TL;DR我们提出了一种称为广义代表器的基于样本的机器学习模型解释的通用类,其测量训练样本对模型测试预测的影响,使用两个组件:度量训练点对模型的重要性并对测试样本不变的全局样本重要性,以及使用核函数来衡量训练样本和测试点的相似性的本地样本重要性。本文的一个重要贡献是展示广义代表器是唯一满足一组自然公理属性的基于样本的解释类。我们讨论了在给定核函数的情况下提取全局重要性的方法,以及在现代非线性模型中的自然核函数选择。正如我们展示的,许多流行的现有样本解释可以被视为使用特定核函数和提取全局重要性方法的广义代表器。此外,我们对两个图像分类数据集和两个文本分类数据集上的不同广义代表器进行了实证比较。