Apr, 2025

大语言模型能否学习形式逻辑?一种数据驱动的训练与评估框架

TL;DR本研究探讨大型语言模型(LLM)的逻辑推理能力,针对传统逻辑证明的训练提供了一种新的数据增强方法。通过合成有效证明和模板转化,研究发现LLM在短证明的推理能力强,但在复杂证明时能力下降,模板转化显著提升了模型的准确性,揭示了其对不同规模模型的广泛适用性。