CD工具——简化引理证明的削减和结构生成(系统描述)
该论文介绍了Thor,一个集成语言模型和自动定理证明器的框架,它采用一种称为“hammers”的方法来选择前提,从而增加了语言模型在PISA数据集上的成功率并解决了相当一部分问题,同时比现有最佳方法在MiniF2F数据集上具有更小的计算量。
May, 2022
应用高阶自动推理证明器探索 Boolos' Curious 推论,通过提供适当的简写符号以发现短证明所需的高阶引理,并提出全证明自动化的可能性。
Aug, 2022
本文介绍了一种将组合子术语表示为证明树的方法,并引入了基于参数化组合子术语定义的证明模式,实现了基于连接结构演算的特征的自动化一阶证明的实现和第一批实验结果。
Sep, 2022
本研究通过对克雷格插值的输入和输出进行限制,并结合一阶 ATP 推导系统的子句平板验证方法,证明了在一阶逻辑中可以传递范围限制和 Horn 属性。同时,我们还展现了一种解决限制子句平板结构一般问题的方法,并将其应用于查询综合和插值重构。该方法结合了证明结构操作和高度优化的一阶推理器,具有可行的实现前景。
Jun, 2023
本文介绍了 LeanDojo:一个开源、可交互的证明环境,它从Lean中提取了证明中的数据及注释,提供了有价值的前提数据,以便于选取前提。 我们使用此数据,开发了 ReProver:第一个增加检索功能的基于LLM的证明程序。其成本低廉,只需要一台GPU进行一周的训练,并且可以有效地选择定理中的前提。我们构建了一个包含96962个定理和证明的新基准,并将其用于培训和评估。实验结果表明,相对于非检索基线和GPT-4,ReProver非常有效。我们发布了代码和数据集,以促进进一步的研究。
Jun, 2023
通过引入符号性的自上而下求解器,与大型语言模型的集成,SymBa在多步推理基准测试中(ProofWriter,Birds-Electricity,GSM8k,CLUTRR-TF,ECtHR Article 6)相对于基线算法实现了性能、证明准确性和效率的显著提升。
Feb, 2024
本研究提出了DeepSeek-Prover-V1.5,一个用于Lean 4的开源语言模型,针对定理证明进行了优化,解决了训练和推理过程中的效率问题。创新性地采用了来自证明助手反馈的强化学习方法,并引入RMaxTS变体,以多样化的证明路径生成为目标。结果显示该模型在中学和本科水平的基准测试中取得了显著的成绩提升,展示了其在推理任务中的潜在影响。
Aug, 2024