ACLApr, 2022

模型解释性方法忠实度度量的比较研究

TL;DR在研究机器学习模型内部推理过程的解释方法越来越受到关注的今天,我们发现不同的忠诚度评估指标在比较不同的解释时显示出冲突的偏好,因此我们旨在对广泛采用的忠诚度指标进行全面而比较的研究,并引入两个评估维度:诊断性和时间复杂性,根据实验结果,我们发现足够性和综合性指标具有更高的诊断性和更低的时间复杂度。