Feb, 2024

ReAGent:面向生成语言模型的无模型特征归因方法

TL;DR我们提出了一种递归归因生成器(ReAGent)方法,用于生成语言模型的模型无关特征归因,通过计算原始输入和替换部分输入进行比较,确保我们的方法在各种解码器模型中提供更加准确的关键词重要性分布。