BriefGPT.xyz
大模型
Ask
alpha
关键词
e-eval
搜索结果 - 1
E-EVAL:大型语言模型的全面中国 K-12 教育评估基准
通过介绍首个专为中国 K-12 教育领域设计的综合评估基准 E-EVAL,针对 LLM 在该领域的各种能力提供准确评估。E-EVAL 由 4,351 道初、中、高级别的选择题组成,并涵盖语文、英语、政治、历史、伦理、物理、化学、数学和地理等
→
PDF
5 months ago
Prev
Next