文章提出了一种基于预训练语言模型的多任务框架 Generate & Rank,该框架采用生成和排名的方法,在生成数学表达式的同时实现了决定正确和错误表达式等级的新的排名任务。结果表明,该方法在公共基准数据集中表现出色,比现有方法提升了 7% 的性能。
Sep, 2021
本文探讨了跨语言和多语言下的数学应用问题,使用预训练的多语言模型构建模型,并使用序列到序列模型进行求解。通过比较跨语言和多语言场景下数学应用问题的求解情况,表明将模型迁移到不同的语言上可能会导致性能下降,但如果问题类型存在于源语言和目标语言中,则其性能可以得到完善提升。
May, 2021
本文提出了一种新颖的 MWP 求解器,利用类比方法,通过将类比 MWP 对在潜在空间中进行关联以增强求解器的泛化能力,整合了解决方案鉴别器以增强 MWP 表示和真实解决方案的关联,评估结果证实,我们的模型相比最先进的模型 Generate2Rank,在 Math23k 数据集上表现更好并且编码器参数量减少了 5 倍,我们还发现我们的模型具有更强的泛化能力,能够解决难度较大的 MWP 问题。
Dec, 2022
该论文提出了一种用于解决数学问题的框架,该框架基于生成问题文本的语言变体,利用 DeBERTa 编码器构建解决方案表达式,通过对每个变体问题进行求解并选出获得大多数选票的预测表达式来改善数学推理和模型的鲁棒性。
Jun, 2023
通过采用自我一致性推理框架 SCR,其中利用修剪策略来纠正输入文本和输出表达式之间的虚假相关样本,进而通过对称的 Kullback-Leibler 分歧来校准输出分布偏移,SCR 生成等效表达式,并在两个大型基准实验中表现出优越性。
Oct, 2022
本文介绍了一种名为 MeSys 的基于意义理解和推理的方法,用于解决英语数学词问题,该方法使用逻辑表达式进行初步分析,采用角色标签表示每个数量的相关背景,并使用统计模型来选择运算符和操作数;实验结果表明该方法在理解文本中每个数量的意义方面具有优势。
Mar, 2018
本文提出一种对数学文字问题解决方案的改进方法,通过对原型方程进行比对学习,训练神经网络识别相似原型的问题,并在中英文数据集上取得了大幅提升的表现。
Oct, 2021
该研究分析了现有的 NLP 求解器在解决低年级英语数学问题时的表现,指出现有求解器主要依赖于表面浅显的启发式策略。同时,研究提出了一个挑战数据集 SVAMP,并证明当前最优模型的表现还有很大的提升空间。
Mar, 2021
通过只需要问题答案进行监督,我们提出了一种弱监督模型来解决数学应用问题,我们首先学习使用问题描述和最终答案生成公式,然后使用生成的公式来训练一个有监督的数学应用问题求解器。
Apr, 2021
本研究提出两种方法生成对抗性攻击,以评估现有的数学单词问题求解器的鲁棒性,并发现现有的数学单词问题求解器对问题文本中的语言变化非常敏感。