May, 2024

XPrompt:通过联合提示归因解释大型语言模型的生成

TL;DR该研究引入了基于联合提示归属的反事实解释框架 XPrompt,旨在解释少数提示文本是如何共同影响大型语言模型(LLM)的完整生成,并通过定义和利用多个评估指标来展示我们框架的忠实度和效率。