May, 2024

LACIE: 大型语言模型中关注听众的细化调校来增强置信度校准

TL;DR为了解决当前大多数模型过于自信的问题,我们引入了一种称为LACIE的训练方法,通过模拟一个听众来校准LLMs的内隐和外显置信度标记,实验结果表明,经过LACIE训练的模型在置信度上表现得更好,并且LACIE方法在其他数据集上也具有泛化能力,并提高了模型对正确与错误示例的分辨能力,并通过包含细节和使用权威语调来暗示正确时的确定性,最后,LACIE训练导致了模型自动放弃对错误答案的回答。