Jul, 2023

通过语义匹配修正特征归因方法中的确认偏差

TL;DR本文介绍了解决黑盒模型中 feature attribution 方法的一个严重问题 —— 在人类概念下的可靠解释性问题,提出了一种基于语义匹配的结构化方法来评估模型的可解释性,并在实验中得出了关于评估语义匹配的指标和结果,旨在解决 XAI 领域中的确认偏误问题。