EMNLPAug, 2021

用离散化的综合梯度来解释语言模型

TL;DR本文针对 Integrated Gradients 在文本数据中由于词嵌入空间的固有离散性导致插值点不够具有代表性的问题,提出了基于离散化插值策略的 Discretized Integrated Gradients 方法,与 Integrated Gradients 方法相比,本方法计算出的梯度更符合实际情况,有效性得到了实验和人工评估的验证。