May, 2022

神经定理证明的超树式证明搜索

TL;DR我们提出了一种基于 Transformer 的自动定理证明器的在线训练过程,并使用 AlphaZero 的新型搜索算法 HTPS。我们通过在线训练从以前的证明搜索中学习,使其可以概括到远离训练分布的域。通过研究逐渐复杂的三个环境的性能,我们报告了我们管道主要组件的详细消除。我们证明,在仅使用 HTPS 的情况下,一个在注释证明上训练的模型可以证明 65.4% 的 Metamath 定理的保留集,显著优于 GPT-f 的 56.5% 的先前技术水平。这些未经证明的定理的在线训练将准确性提高到 82.6%。在类似的计算预算下,我们将对 Lean-based miniF2F-curriculum 数据集的技术水平从 31%提高到 42%的证明准确性。