BriefGPT.xyz
Ask
alpha
关键词
f-eval
搜索结果 - 1
F-Eval: 使用精细评估方法评估基本能力
我们提出了 F-Eval,这是一个双语评估基准,旨在评估大型语言模型的基本能力,包括表达能力、常识和逻辑。我们进行了 13 个先进 LLM 的评估,结果显示我们的评估方法与其他评估者相比具有更高的相关系数和更大的区别,并讨论了不同模型大小、
→
PDF
5 months ago
Prev
Next