Feb, 2024

LLMs 数学推理中的数据能力边界的实证研究

TL;DR通过识别推理路径的最佳集合来确定推理路径增强的能力边界,通过不同类型的数据的最佳集合的混合来累积增强模型的不同能力,以较低的建设成本实现 SOTA 性能,并提供用于鲁棒性测试和教育应用的自动问题生成器。