Sep, 2022

特征归因的稳定性评估框架:您的解释是否稳健?

TL;DR提出了一种模型无关的方法 MeTFA 用于量化不确定性并增加解释算法的稳定性,该方法可将信任度提高,并可在保持可信度的同时显著减少不稳定性,并展示了在语义分割模型中定位上下文偏差和抵御针对解释的对抗攻击的潜在能力。