Jul, 2023
通过语义匹配修正特征归因方法中的确认偏差
Fixing confirmation bias in feature attribution methods via semantic match
Giovanni Cinà, Daniel Fernandez-Llaneza, Nishant Mishra, Tabea E. Röber, Sandro Pezzelle...
TL;DR本文介绍了解决黑盒模型中 feature attribution 方法的一个严重问题 —— 在人类概念下的可靠解释性问题,提出了一种基于语义匹配的结构化方法来评估模型的可解释性,并在实验中得出了关于评估语义匹配的指标和结果,旨在解决 XAI 领域中的确认偏误问题。