融合、推理和验证:几何问题的图形解决方案与解析子句
构建了一个大规模的几何问题的数据集,并提出了一种基于形式语言和符号推理的新的解决方案,称为可解释几何问题求解器(Inter-GPS),其能够显著提高当前方法的解决几何问题的效果。
May, 2021
本文提出了一种基于深度学习和图推理的强大图解析器,通过修改实例分割方法提取几何基元,借助图神经网络(GNN)实现几何关系分析和基元分类,并结合几何特征和先验知识将所有模块集成到名为PGDPNet的端到端模型中,该模型实现了所有子任务的高效解决。此外,我们建立了一个名为PGDP5K的新的大规模几何图表数据集,进行了实验,并与现有数据集IMP-Geometry3K进行比较,发现我们的模型在四个子任务上显着优于现有方法。
May, 2022
本文提出了一种基于神经网络的解题方案PGPSNet来解决几何问题求解中的模态融合问题;通过把图解转化成文本描述来更有效地描述数据特征,并结合结构和语义训练、数据增强和自限制解码等来增强几何理解和推理。此外,还构建了一个新的大规模、细粒度的PGPS9K数据库来帮助该领域的研究。我们在PGPS9K和Geometry3K数据集上的实验验证了该方法的优越性。
Feb, 2023
通过开发一个符号字符感知模型,该研究旨在完全探索符号字符在文本和图解理解中的角色,并在多模态推理框架下优化模型。该模型在解决几何问题的通用编码器-解码器流水线中得到整合,经过大量实验,在两个基准数据集(GeoQA和Geometry3K)上展现了卓越性能,极大提高了问题解答的准确率和步骤效率。
Aug, 2023
本文提出了一种名为LANS的布局感知神经求解器,集成了两个新模块:多模态布局感知预训练语言模型(MLA-PLM)和布局感知融合注意力(LA-FA),通过全局关系建模和对齐来实现布局感知,并通过布局感知注意力实现点导向的跨模态融合,该求解器在几何数据集上的实验证明了布局感知模块的有效性和超越现有符号求解器和神经求解器的问题求解性能。
Nov, 2023
应用现代人工智能技术解决几何问题和自动演绎证明一直以来都是数学和人工智能交叉领域的重要挑战。本文提出了一种名为FGeo-P的定理预测器,利用语言模型预测几何问题的定理序列,从而提高了解决几何问题的性能,实验证明在FormalGeo7k数据集的问题解决率从39.7%提升至80.86%。此外,FGeo-TP在不同难度问题上表现出了解决时间和搜索步骤显著减少的特点。
Feb, 2024
我们构建了一种神经符号系统,利用神经部分(HyperGNet)根据超树预测定理,并利用符号部分(FormalGeo)应用定理和更新超树,从而形成了一个可追踪的、可读的几何问题自动求解的预测-应用循环,实现了87.65%的逐步准确率和85.53%的总体准确率。
Feb, 2024
提出了一个名为DualGeoSolver的双重推理几何求解器,通过模拟人类的双重推理过程,从对人类推理过程和知识应用的显式建模中提高求解几何问题的准确率和鲁棒性。
May, 2024
该研究针对AI模型在处理几何问题时面临的语义和视觉信息不足的挑战,提出了图示形式化增强的几何问题求解框架(DFE-GPS)。通过引入新的合成数据方法和大规模几何数据集SynthGeo228K,研究显著提升了多模态语言模型对几何图形的理解能力,拓展了其在开放式任务中的应用潜力。
Sep, 2024
本研究针对人工智能在几何问题求解中面临的数学推理挑战,提出了一种新的框架DFE-GPS,通过结合视觉特征、几何形式语言和自然语言表示来改善现有模型在理解几何图形上的能力。我们的主要发现是,使用新开发的合成数据集SynthGeo228K后,模型在几何问题解决方面表现显著提升,扩展了其在开放式任务中的应用。
Sep, 2024