Apr, 2025
Kimina-Prover预览:面向大型形式推理模型的强化学习
Kimina-Prover Preview: Towards Large Formal Reasoning Models with
Reinforcement Learning
TL;DR本研究针对传统形式定理证明方法的效率问题,提出了Kimina-Prover Preview,这一新的推理驱动的探索范式能够有效模仿人类的解题策略。研究表明,Kimina-Prover在miniF2F基准测试中达到80.7%的表现,且在样本效率和模型规模上均表现出良好的可扩展性,展示了在形式验证与非正式数学直觉之间架起桥梁的潜力。