Feb, 2025

基于反馈的多步骤推理在大型语言模型数学应用中的调查

TL;DR本研究针对大型语言模型(LLM)在数学推理中的多步骤过程,主要填补了反馈整合的研究空白。通过调查不同的反馈策略,该论文提出了增强LLM推理能力的新方法,包括逐步和结果反馈的结合。研究结果表明,通过有效利用反馈,LLM的多步骤推理能力显著提升,推动了该领域的进一步研究。