Feb, 2023

解释的普适性

TL;DR本文提出了一种新的可解释性方法评估方法,从可泛化性的角度出发,使用自编码器学习生成解释的分布,并观察其可学性和学习分布特征的合理性;同时进行了 LIME 可解释性方法的直观演示,以及对多个流行可解释性方法的数量评估,并发现使用 SmoothGrad 来平滑解释可以显著增强解释的泛化性。