ICLRMar, 2024

不要相信:验证 - 用自动形式化证明 LLM 定量推理的基础

TL;DR通过自动生成验证的形式化 Isabelle 代码,我们的方法能够自动排除具有内在一致性问题或与形式化问题陈述不一致的解,并在多个数据集和模型大小上比以前最佳方法 — 普通多数投票 — 提高了 12% 以上的准确性。