BriefGPT.xyz
Ask
alpha
关键词
chinese mathematical reasoning benchmarks
搜索结果 - 1
SuperCLUE-Math6: 适用于中文语言模型的分级多步数学推理基准测试
我们引入了 SuperCLUE-Math6(SC-Math6),这是一个新的基准数据集,用于评估中文语言模型的数学推理能力。SC-Math6 是 GSM8K 数据集的升级版,具有增强的难度、多样性和应用范围。它包含了 2000 多个需要多步
→
PDF
6 months ago
Prev
Next