BriefGPT.xyz
Ask
alpha
关键词
capability parameter
搜索结果 - 1
LLM 开放环境下的对等评审:自动评估方法
通过使用同行评审机制来自动测量大型语言模型的能力并评估其性能,我们提出了一种新颖的无监督评估方法,并通过为每个语言模型分配可学习的能力参数来调整最终排名,以最大化每个语言模型的能力和得分的一致性,并使用 PEN、CIN 和 LIS 三个指标
→
PDF
5 months ago
Prev
Next