Oct, 2024

OpenMathInstruct-2:利用大规模开源指令数据加速数学AI

TL;DR本研究解决了大语言模型在数学推理方面缺乏开源训练数据的问题。通过对数据合成的精心消融实验,提出了生成高质量数学推理微调数据集OpenMathInstruct-2,显著增大数据集规模并提升模型性能,取得了15.9%的准确性提升。该工作提供了重要的数据和模型资源,以促进后续开源研究。