Aug, 2024

无限数学:一种可扩展的程序化数学推理指令调优数据集

TL;DR本研究解决了现有大规模数据集创建中所面临的种子数据需求和高计算成本的挑战。我们提出的InfinityMATH是一个可扩展的指令调优数据集,通过将数字与数学问题解耦,促进了数据合成的灵活性和高效性。实验证明,使用该数据集进行微调的模型在各类基准测试中表现出显著的性能提升,拓宽了模型在多种数学问题上的适用性。