Mar, 2024

因果启发式:基于前门调整的大型语言模型提示去偏

TL;DR通过揭示结构性因果模型的因果关系,提出了一种基于前门调整的新颖因果提示方法,通过设计不访问大型语言模型的参数和逻辑回归的提示,实施因果干预,并通过前门调整计算输入提示和输出答案之间的因果效应来减轻模型偏差。