Sep, 2024

S$^3$c-Math:自发逐步自我修正使大型语言模型成为更好的数学推理者

TL;DR该研究解决了大型语言模型在数学推理中的自我修正能力不足的问题。提出了一种称为S$^3$c-Math的数学LLM系列,能够自发地进行逐步自我修正,识别并纠正推理过程中的错误,从而提升推理的可靠性。研究结果显示,该方法在GSM8K、MATH等数学基准测试中表现显著优越,推动了LLM在数学推理领域的进步。