BriefGPT.xyz
Ask
alpha
关键词
confidence score metrics
搜索结果 - 1
思维周期:通过稳定解释衡量 LLM 的信心
通过使用解释蕴涵作为分类器可能性,我们提出了一种框架来测量语言模型不确定性,以改善置信度指标 (AURC 和 AUROC)。
PDF
a month ago
Prev
Next