Feb, 2024

InternLM-Math: 面向可验证推理的开放数学大语言模型

TL;DR我们介绍并开源了我们的数学推理 LLMs InternLM-Math,它是从 InternLM2 继续预训练的,将序列到序列格式中的思维链推理、奖励建模、形式推理、数据增强和代码解释器统一起来,监督我们的模型成为一个多功能的数学推理者、验证者、证明者和扩充器。我们的预训练模型在各种非正式和正式基准测试中,包括 GSM8K、MATH、匈牙利数学考试、MathBench-ZH 和 MiniF2F,在即时学习、监督微调和代码辅助推理的环境设置下,取得了最先进的性能,MiniF2F 测试集上实现了 30.3 的成绩。我们进一步探索了如何使用 LEAN 解决数学问题,并研究了在多任务学习的环境设置下的性能,这表明了使用 LEAN 作为数学问题求解和证明的统一平台的可能性。我们的模型、代码和数据已在 https://github.com/InternLM/InternLM-Math 上发布。