May, 2024

ATG:基于生成式语言模型的自动定理生成基准测试

TL;DR自动生成定理是一个挑战,本文提出了一个基于自动化定理生成(ATG)的评估基准,以探究当前生成性语言模型(LMs)在生成新定理和可重复定理方面的能力,结果表明当前 LMs 仍有改进空间。