ACLFeb, 2024

SyntaxShap: 一种文本生成的语法感知解释性方法

TL;DR为了在安全关键领域利用大型语言模型的力量,我们需要确保其预测的可解释性。本文介绍了 SyntaxShap,一种针对文本生成的局部、模型无关的可解释性方法,考虑了文本数据中的句法结构。通过扩展 Shapley 值来考虑基于解析的句法依赖关系,SyntaxShap 只考虑受依赖树约束的联盟。我们采用基于模型的评估方法,比较 SyntaxShap 及其加权形式与适用于文本生成任务的最先进的可解释性方法,包括忠实度、复杂性、连贯性以及解释与模型的语义对齐等多个度量标准。我们表明,我们的句法感知方法能够生成更忠实、连贯和可解释的预测解释,适用于自回归模型。