Sep, 2024

基于大型语言模型的对话状态追踪的信心估计

TL;DR该研究针对基于大型语言模型的对话系统在输出时信心估计的缺乏问题,提出了一套全面的方法评估和利用模型的不确定性,以改善对话状态追踪的可靠性。研究发现,开放权重模型的微调可以显著提升信心分数的校准效果,从而提高模型性能和决策准确性。