BriefGPT.xyz
Ask
alpha
关键词
scieval
搜索结果 - 1
SciEval: 一个用于科学研究的多级大型语言模型评估基准
这篇论文提出了 SciEval 基准评估体系,以解决现有预先收集客观问题的数据泄露问题和缺乏主观问答能力评估的问题。SciEval 基于 Bloom 的认知分类学,覆盖了四个维度,系统评估科学研究能力。研究者进行了全面的实验证明,尽管 GP
→
PDF
10 months ago
Prev
Next