Dec, 2024

神经符号数据生成用于数学推理

TL;DR本研究旨在解决大型语言模型在数学推理中表现不足的问题,通过开发一种自动化方法生成高质量的监督数学数据集。该方法结合了大语言模型的直观非正式化优势和数学求解器的精确符号推理能力,生成的数据在实证实验中表现出色,使得LLaMA-2和Mistral在重新对齐后优于现有的同类模型。