本文提出了一种通过控制代码来引导模型考虑某些推理逻辑和解码与人类参考转换的相应等式表达式的可控等式生成求解器,实验结果表明我们的方法对单一未知(Math23K)和多个未知(DRAW1K,HMWP)基准测试普遍提高了性能,最大的改善高达 13.2%的准确性在具有挑战性的多未知数据集上
Sep, 2022
该研究提出了一种基于编码器 - 解码器的模型,完全利用问题文本并保留逐步的交换律,以产生无论数量的排列方式如何都具有不变性的表达式嵌入,并进一步对问题文本进行编码以指导解码过程,可以提高数学问题自动求解程序的性能。
Feb, 2023
本文提出了一种神经符号求解器 (NS-Solver),能够显式且无缝地结合不同级别的符号约束,其中包括问题编码器、符号方程式生成器和符号执行器。在四个新辅助任务的帮助下,我们的求解器不仅能够自我监督数字预测任务,还能进行常识常数预测、程序一致性检查和二元学习任务,有助于提高求解器的理解力。此外,我们还构建了一个新的大规模数学问题基准 CM17K,包括四种类型的 MWP (算术、一元线性、一元非线性和方程集),共超过 17K 个样本。对 Math23K 和我们的 CM17K 的大量实验结果表明,与现有最先进方法相比,我们的 NS-Solver 优越性表现出色。
Jul, 2021
通过将大型语言模型与外部符号求解器相结合,我们提出了一种能够将单词问题逐步规范化为一组变量和方程的方法,并使用符号求解器解决问题,相较于 PAL 在解决代数类问题上性能提升了 20%。
Apr, 2023
本研究提出了一种通过神经网络模型从常识知识图谱和方程式中生成多样化数学单词问题的方法,并在教育评估方面表现出优越性,其中自规划模块实现了方程和常识知识信息的自动融合。
Oct, 2020
该论文提出了一种用于解决数学问题的框架,该框架基于生成问题文本的语言变体,利用 DeBERTa 编码器构建解决方案表达式,通过对每个变体问题进行求解并选出获得大多数选票的预测表达式来改善数学推理和模型的鲁棒性。
Jun, 2023
本文提出了使用 Transformer 网络将数学问题转化为等价的前缀、中缀和后缀表达式,并使用预训练的通用文本语料库进行训练以提高性能,与以往最先进的方法相比,最好的神经网络方法可将准确率平均提高近 10%。
Dec, 2019
本文介绍了一种人类模拟学习的方法,利用记忆模块、表征模块、类比模块和推理模块来解决数学文字题,实验结果表明该算法比其他现有算法表现更好。
Sep, 2021
基于神经网络的自动数学问题求解器在解决算术问题方面成功地达到了 70-80%的准确率,然而研究表明这些求解器可能依赖表面模式得到方程。为了确定数学问题求解器使用哪些信息生成解答,我们移除输入的一部分并测量模型对扰动数据集的表现。结果表明,当给出无意义问题时,即使从输入中删除许多单词,模型也不敏感并仍能找到正确答案。这表明自动求解器并不遵循数学问题的语义逻辑,可能过拟合于特定单词的存在。
Jul, 2023
本文介绍了一种新的自动解决算术词问题的方法,它是第一种能够处理多步骤和多操作算术问题的算法方法,不依赖于附加的注释或预定义的模板。作者提出了一种表达式树的理论,可以用于表示和评估目标算术表达式,并将其唯一分解为多个分类问题;然后,作者采用受限推理框架将这些问题组合成表达式树,并通过 “数量模式” 提升模型表现,实验结果表明,该方法在算术词问题的基准数据集上实现了业界领先的性能。
Aug, 2016