Apr, 2025
DeepMath-103K:一个大规模、具有挑战性、去污染且可验证的数学数据集,以促进推理能力的发展
DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and
Verifiable Mathematical Dataset for Advancing Reasoning
TL;DR本研究解决了人工智能在复杂数学推理中数据不足的问题,推出了DeepMath-103K这一新的大规模数学问题数据集,旨在通过强化学习来训练高级推理模型。该数据集提供验证答案,极大提升了现有资源的挑战性,并展示了训练模型在复杂数学基准测试中的显著改进,为社区发展更具能力的AI推理系统奠定基础。