May, 2023

Calc-X:通过与符号系统交互来丰富算术思路链数据集

TL;DR本报告概述了我们正在进行的工作,即通过集成计算器等非参数组件来丰富需要算术推理的思维链数据集。我们对GSM8K、Ape210K、AQuA-RAT和MathQA等显着相关的数据集进行了分析,并提出了一个特别适用于半结构化链工作的机器可处理的类似HTML的格式。通过将数据集转换为这个统一的格式,我们使得大型语言模型和符号系统的有效集成成为可能,从而使它们更有效地处理算术推理任务。