BriefGPT.xyz
Ask
alpha
关键词
fktc
搜索结果 - 1
评估大型语言模型知识的可靠性
本文提出了一种名为 MONITOR 的新度量方法,用于直接衡量大型语言模型的事实可靠性,通过计算有效输出与同一模型使用不同类型提示和上下文进行探索所产生的对应输出之间的概率分布距离来评估模型的一致性。实验证明 MONITOR 对于评估大型语
→
PDF
9 months ago
Prev
Next