Nov, 2022
Explainer Divergence Scores (EDS): 一些事后解释可能有效于检测未知的虚假相关性
Explainer Divergence Scores (EDS): Some Post-Hoc Explanations May be Effective for Detecting Unknown Spurious Correlations
Shea Cardozo, Gabriel Islas Montero, Dmitry Kazhdan, Botty Dimanov, Maleakhi Wijaya...
TL;DR提出了用信息理论方法评价 Deep Neural Networks 中的解释器的新方法,并发现 post-hoc 解释器对 DNN 与假象的依赖性具有相当大的信息量,但这种信息常常难以察觉。