Mar, 2024

BAIT:交互证明(嵌入)架构的基准测试

TL;DR人工智能在定理证明方面,尤其是在交互定理证明中,已经产生了许多基准和方法。本文介绍了 BAIT,一个公正而简化的比较学习方法在交互定理证明中的框架,通过对多个基准的深入比较,展示了 BAIT 的能力。我们发现结构感知变换器表现特别好,改进了与原始问题集相关的技术。BAIT 还允许我们评估基于交互环境构建的系统的端到端证明性能。通过简化机器学习算法在 ITP 上的实现和比较,我们预计 BAIT 将成为未来研究的跳板。