Aug, 2023

使用 GPT-4 代码解释器及基于代码的自验证解决复杂数学问题

TL;DR通过对 GPT-4 Code Interpreter 的代码使用频率引入不同约束,本文探讨了代码在增强 LLMs 推理能力方面的效果。基于这种见解,我们提出了一种新颖有效的提示方法,即基于代码的自验证(CSV),进一步提升了 GPT-4 Code Interpreter 的数学推理潜力。使用 GPT-4 Code Interpreter 和 CSV,我们在 MATH 数据集上实现了令人印象深刻的无需训练准确率(53.9% → 84.3%)。