基于数据驱动的代数文字问题解决方法
本文提出了一个神经网络模型,基于编码器 - 解码器框架,利用自然语言理解桥接语义世界和符号世界,自动解决数学应用问题,并在 Math23K 数据集上验证模型的有效性。
Nov, 2018
本研究论文从近十年开始,对自动解决数学单词问题的算法进行了批判性评估和未来研究规划,主要关键词为数学单词问题、算法、深度学习模型、数据集设计和研究。
May, 2022
本文展示神经网络在数学方面的应用,如符号积分和求解微分方程。提出了一套数学问题表示法和生成大规模数据集进行序列到序列模型训练的方法,并获得了超越 Matlab 或 Mathematica 等商业计算机代数系统的结果。
Dec, 2019
基于神经网络的自动数学问题求解器在解决算术问题方面成功地达到了 70-80%的准确率,然而研究表明这些求解器可能依赖表面模式得到方程。为了确定数学问题求解器使用哪些信息生成解答,我们移除输入的一部分并测量模型对扰动数据集的表现。结果表明,当给出无意义问题时,即使从输入中删除许多单词,模型也不敏感并仍能找到正确答案。这表明自动求解器并不遵循数学问题的语义逻辑,可能过拟合于特定单词的存在。
Jul, 2023
本文介绍了一种新的自动解决算术词问题的方法,它是第一种能够处理多步骤和多操作算术问题的算法方法,不依赖于附加的注释或预定义的模板。作者提出了一种表达式树的理论,可以用于表示和评估目标算术表达式,并将其唯一分解为多个分类问题;然后,作者采用受限推理框架将这些问题组合成表达式树,并通过 “数量模式” 提升模型表现,实验结果表明,该方法在算术词问题的基准数据集上实现了业界领先的性能。
Aug, 2016
本文提出了一种通过控制代码来引导模型考虑某些推理逻辑和解码与人类参考转换的相应等式表达式的可控等式生成求解器,实验结果表明我们的方法对单一未知(Math23K)和多个未知(DRAW1K,HMWP)基准测试普遍提高了性能,最大的改善高达 13.2%的准确性在具有挑战性的多未知数据集上
Sep, 2022
介绍了一种新的 MATH 数据集,其中包含 12500 个具有挑战性的竞赛数学问题,每个问题都有全面的解决方案,可以用于教模型生成答案推导和解释。尽管研究者不断增加 Transformer 模型的预算和参数总数,但在 MATH 的准确性仍然相对较低,因此未来的研究可能需要更广泛的算法进步。
Mar, 2021
使用语言模型自动生成的 K-8 数学题库,通过定期优化和专家标注的数据,得到了迄今规模最大的英语数学题库,其中有 20,490 个问题,其中 3,484 个经过领域专家评分,发现 MATHWELL 比其他方法生成的问题更容易求解、准确和适用,有 74% 的问题有可解答的解决方案,并满足所有标准。
Feb, 2024
介绍了一个大规模的数学问题数据集和一个可解释的神经数学问题求解器,该求解器学习将问题映射到操作程序。使用新的表示语言,MathQA 数据集明确地注释了各种类型的问题的操作程序,同时提高了模型的性能和可解释性。通过自动问题分类,我们的实验结果在 MathQA 和 AQuA 数据集上均优于竞争基线,但仍显著低于人类表现,这表明该数据集为未来研究提出了新的挑战。
May, 2019