BriefGPT.xyz
Ask
alpha
关键词
scientific problem-solving
搜索结果 - 1
SciBench:评估大规模语言模型的大学科学问题解决能力
最近大型语言模型 (LLM) 在许多数学基准上取得显著进展,但大多数基准只涉及初高中科目的问题和多项选择题,且仅限于有限范围的基本算术操作。为解决这些问题,本文引入了一个广泛的基准套件 SciBench,旨在系统地检验复杂科学问题解决所需的
→
PDF
a year ago
Prev
Next