May, 2024

利用自反论辩教授 LLM 学生表达自信

TL;DR使用先进的 SaySelf 训练框架,通过自动总结知识不确定性以及分析不一致性,教导大语言模型表达更准确的细粒度置信度评估,并通过强化学习和奖励机制校准置信度估计,降低校准错误并保持任务性能。