基于大规模合成数据,使用 Lean 4 proof 数据生成方法,我们的模型在定理生成和解决题目方面取得了卓越的成果,证明了合成数据对提高 LLMs 中的定理证明能力的潜力。
May, 2024
通过人工提供或查找背景参考条件,NaturalProver 能够生成数学证明,融合符号和自然语言,提高了下一步建议和生成证明的质量,在某些需要短证明的定理上具有证明能力,并且提供的下一步建议有超过 40% 的正确和有用率。
May, 2022
本文介绍了 LeanDojo:一个开源、可交互的证明环境,它从 Lean 中提取了证明中的数据及注释,提供了有价值的前提数据,以便于选取前提。 我们使用此数据,开发了 ReProver:第一个增加检索功能的基于 LLM 的证明程序。其成本低廉,只需要一台 GPU 进行一周的训练,并且可以有效地选择定理中的前提。我们构建了一个包含 96962 个定理和证明的新基准,并将其用于培训和评估。实验结果表明,相对于非检索基线和 GPT-4,ReProver 非常有效。我们发布了代码和数据集,以促进进一步的研究。
Jun, 2023
使用 Lean 等计算机可验证形式语言来证明数学定理具有重大影响,本文提出了 TheoremLlama 框架,通过生成对齐的数据集和训练方法,使大型语言模型成为 Lean4 专家,实现了高于 GPT-4 基准的累积准确率。
Jul, 2024
DS-Prover 是一个用于定理证明的创新动态抽样方法,通过根据剩余时间和总分配时间来调整探索和开发之间的平衡,以提高证明搜索过程的效率,并通过拆分简化和重写策略为具有单个前提的策略来扩充训练数据集,从而在 MiniF2F 和 ProofNet 两个标准数据集上实现了显著的性能提升。
Dec, 2023
该研究实现并运用了一些适当的标准去分析 HOL Light 和 Flyspeck 等正式数学库中的引理图,从而提高了自动化定理证明的效率和准确性。
Feb, 2014
本文探讨了基于 Transformer 的语言模型在自动定理证明中的应用,提出了基于语言模型的生成能够解决自动定理证明器与人类相比的主要限制之一 —— 原始数学术语的生成问题。我们提出了一个自动证明器和证明辅助工具 GPT-f,使用 Metamath 形式语言,并分析了其性能。 GPT-f 发现了新的简短证明,并被采纳为正式数学社区所接受,这是我们所知道的第一次基于深度学习的系统为正式数学社区做出的贡献。
Sep, 2020
利用 Lean 框架,将复杂的逻辑推理问题形式化为定理后进行求解,以减少逻辑不一致性的风险并提升处理复杂推理任务的能力,取得了在 FOLIO 数据集上的最先进表现,并在 ProofWriter 上接近该水平的成果。值得注意的是,这些结果是在每个数据集的不到 100 个领域内样本进行微调实现的。
Mar, 2024
为了解决自动定理证明中有限的人工编写定理和证明的问题,我们提出了一种学习神经生成器自动生成定理和证明来训练定理证明器的方法,并通过实验验证,证明该方法的合理性,并成功推动了 Metamath 自动定理证明的发展。
Feb, 2020
提出了一种定理证明算法,该算法使用几乎没有领域启发式来指导其连接风格的证明搜索,而是运行许多蒙特卡罗模拟,通过强化学习来指导以前的证明尝试。
May, 2018