BriefGPT.xyz
Ask
alpha
关键词
self-evaluation method
搜索结果 - 1
ACL
语言模型可以通过概率差异进行自我评估
通过证明大型语言模型在回答问题时,如果它们更为熟练,显示更均匀的概率分布,我们启发性地讨论了这个问题。在此基础上,我们提出了一种新的自我评估方法 ProbDiff,用于评估各种语言模型的效能。该方法利用被测试的语言模型计算初始回答与修改版本
→
PDF
2 months ago
Prev
Next