Jun, 2024

不设计,学习:一种可训练的生成式 LLM 不确定性估计评分函数

TL;DR本研究引入了可学习的响应评分函数(LARS)用于生成式大型语言模型中的不确定性估计(UE)。我们提出了 LARS,它利用监督数据来捕捉令牌和概率之间的复杂依赖关系,从而在计算生成物的不确定性时产生更可靠和校准的响应评分。我们在多个数据集上进行了广泛的实验证明,LARS 在各种基于概率的 UE 方法中显著优于现有的评分函数。