Jul, 2024

Skywork-Math: 大型语言模型中的数学推理数据缩放定律--故事将继续

TL;DR研究了增强大型语言模型的数学推理能力的潜在因素,并提出了一种数据缩放定律。通过引入基于Skywork-MathQA数据集的Skywork-Math模型系列,指出增加数据量可以提高模型质量。通过两阶段数据综合和模型SFT流程,包括三种不同的增强方法和不同难度水平的种子问题集,提供了Skywork-MathQA数据集的数量和质量,从而实现了更高的性能。同时,为了研究和工业应用,提供了若干实践经验来提高大型语言模型的数学推理能力。