EMNLPOct, 2023

动态 Top-k 估计整合特征归因方法之间的分歧

TL;DR从归属度量的序列特性来确认应该显示的最佳 k 个令牌数量。在 NLI 任务中,通过比较多种方法和人类之间的一致性,发现基于扰动的方法和 Vanilla Gradient 在静态 k 的大多数方法 - 方法和方法 - 人类一致性指标上具有最高的一致性,但随着动态 ks 的引入,他们相对于 Integrated Gradient 和 GradientXInput 的优势逐渐消失。据我们所知,这是归属度量序列特性在人类解释方面提供信息的首个证据。