BriefGPT.xyz
Ask
alpha
关键词
conceptmath
搜索结果 - 1
ConceptMath:大型语言模型数学推理的双语概念评估基准
本研究介绍了 ConceptMath,它是一个双语(英文和中文)的细粒度基准,用于评估大型语言模型的概念级数学推理能力。与评估一般数学推理平均准确率的传统基准不同,ConceptMath 通过将数学问题按照数学概念的层次进行系统组织,从而可
→
PDF
4 months ago
Prev
Next