BriefGPT.xyz
Ask
alpha
关键词
grouping loss
搜索结果 - 3
从分组损失角度重建 LLMs
大型语言模型 (LLMs),包括 ChatGPT 和 LLaMA,在以自信的口吻生成虚构答案方面容易出错。本文通过构建来自知识库的新评估数据集,评估了 Mistral 和 LLaMA 给出的答案的置信度分数,并展示它们倾向于过于自信。我们还
→
PDF
5 months ago
超越校准:估算现代神经网络的分组损失
本文研究了分类器给出可靠置信度分数的能力,在分组损失的影响下,提出了适用于标准设置下的分组损失估计器,利用该估计器证明了现代神经网络在计算机视觉和自然语言处理中存在分组损失
PDF
2 years ago
足够校准
研究表明,通过使用共单调性作为评估标准,可以缩小概率分类器在校准过程中可观测信息和实际利用信息之间的差距,并且使用 Brier 曲线作为辅助工具可以支持概率分类器的训练和 ' 充分 ' 校准。
PDF
3 years ago
Prev
Next