Jul, 2019

基于原型引导的可解释反事实解释

TL;DR使用类原型的快速、模型无关方法可以找到分类器预测的可解释因果关系解释,并且该方法通过两个新的度量标准在实例级别上定量评估局部可解释性。该方法在图像数据集 MNIST 和表格数据集 Breast Cancer Wisconsin(Diagnostic)上得到了有效的验证,同时消除了由于数值梯度评估而产生的计算瓶颈。