Nov, 2022

Explainer Divergence Scores (EDS): 一些事后解释可能有效于检测未知的虚假相关性

TL;DR提出了用信息理论方法评价 Deep Neural Networks 中的解释器的新方法,并发现 post-hoc 解释器对 DNN 与假象的依赖性具有相当大的信息量,但这种信息常常难以察觉。