关键词mathematical reasoning tasks
搜索结果 - 3
- 超越答案所学:基于反思的数学推理语言模型训练
监督微调通过各种数学推理任务增强了语言模型的问题解决能力。我们的研究引入了一种新的技术 —— 反思增强,通过嵌入问题反思来培养更深入的问题理解,从而不仅提高在标准场景下的性能,还在需要反思性思考的复杂场景中发挥作用。
- 从优秀到卓越:利用工具辅助交错提示改进数学推理
使用 IMP-TIP 框架结合了大型语言模型 (LLMs) 和增强工具的 LLMs 的优势,通过收集和交叉检查多个潜在解决方案,实现对复杂数学推理任务的改进。实验结果表明,IMP-TIP 在数学推理任务中具有增强的能力,相对于传统 LLMs - 程序辅助语言模型
本论文介绍了一种新颖的方法,使用大型语言模型来读取自然语言问题并生成程序作为中间推理步骤,但将求解步骤委托给运行时,如 Python 解释器,在 13 个数学、符号和算法推理任务中展示了神经大型语言模型和符号解释器之间的协同作用。