Mar, 2024

少样本重新校准语言模型

TL;DR通过提出新的少样本特定切片校准框架,使语言模型能够提取出对于任意切片的校准信心估计,可以识别出领域特定的信心阈值,从而改善了准确度并且实验中相较于温度缩放法在 MMLU 上的校准误差提高了 16%。