Oct, 2023

NPEFF:非负每样本费舍尔因式分解

TL;DR我们介绍了一个名为 NPEFF 的新的可解释性方法,可以应用于任何端到端可微分模型。使用 NPEFF,我们将每个示例的 Fisher 信息矩阵分解为非负和的组成部分,这些组成部分可以是非负向量或秩为 1 的半正定矩阵形式,通过实验证明 NPEFF 的组成部分具有可解释的调频。我们进一步展示了 NPEFF 在揭示模型实际处理策略的能力,并探索了它在发现和纠正模型中错误启发式方法的潜在应用。