May, 2019

在大型理论中学习推理,无需模仿

TL;DR本文介绍如何在大型知识库的前提下进行自动定理证明,并通过深度强化学习技术中的基于词频-逆文档频率的查找开发出了一个混合陈述选择方法,以帮助探索并了解哪些前提适用于新的定理证明。实验表明,使用该方法进行训练的定理证明器优于仅以人类证明为基础的证明器,并可以接近于用模仿和强化学习相结合进行训练的证明器的性能。我们还通过多次实验来理解我们的探索方法背后的假设重要性,并解释了我们的设计选择。