Sep, 2024

自适应温度缩放的语言模型校准

TL;DR本研究解决了强化学习反馈后,语言模型校准显著下降的问题。提出了一种新的后处理校准方法——自适应温度缩放(ATS),通过预测每个令牌预测的温度缩放参数,有效地提高了在三个自然语言评估基准中的校准水平,提升幅度超过10-50%,同时保持了强化学习后的性能改进。