Oct, 2024

MathCoder2:通过继续预训练改进数学推理的模型翻译数学代码

TL;DR本研究针对当前数学推理预训练数据集中缺乏直接针对数学推理的代码数据问题,提出了一种新颖的方法,通过高质量数据集结合数学相关网页数据、使用数学包的代码和数学教材等生成数学代码及其推理步骤。研究发现,使用生成的数据训练模型显著提升了其数学推理能力,形成了 MathCoder2 模型系列。