Jun, 2024

通过基于激活的置信度校准和引导解码增强语言模型的真实性

TL;DR在本文中,我们首先提出一种基于激活的校准方法 ActCab,它在语言模型的最后一层激活上训练一个线性层,能更好地捕捉知识的表征。在 ActCab 的基础上,我们进一步提出了一种以置信度为指导的解码策略 CoDec,以从语言模型中得到置信度高的真实答案。通过在五个热门问答基准上进行评估,ActCab 在校准性能方面优于所有竞争基准,例如平均期望校准误差减少了最高 39%。进一步对 CoDec 进行的实验证明,在挑战性问答数据集(如 TruthfulQA)上提升了几个语言模型的真实性,突显了置信度信号在增强真实性方面的价值。