Jan, 2024

CHAMP:一个用于深入分析 LLM 数学推理能力的竞赛级数据集

TL;DR我们提出了 CHAMP 数据集,该数据集包含高中数学竞赛问题,注释了概念和提示,使我们能够探索额外信息对模型性能的影响,发现模型生成的解决方案通常通过错误的推理步骤最终得出正确答案,并且大多数模型在验证这些解决方案时遇到困难。