多模态神经几何求解器：从图解析文本子句

Feb, 2023

多模态神经几何求解器：从图解析文本子句

A Multi-Modal Neural Geometric Solver with Textual Clauses Parsed from Diagram

Ming-Liang Zhang, Fei Yin, Cheng-Lin Liu

TL;DR本文提出了一种基于神经网络的解题方案 PGPSNet 来解决几何问题求解中的模态融合问题；通过把图解转化成文本描述来更有效地描述数据特征，并结合结构和语义训练、数据增强和自限制解码等来增强几何理解和推理。此外，还构建了一个新的大规模、细粒度的 PGPS9K 数据库来帮助该领域的研究。我们在 PGPS9K 和 Geometry3K 数据集上的实验验证了该方法的优越性。

Abstract

geometry problem solving (GPS) is a high-level mathematical reasoning requiring the capacities of multi-modal fusion and geometric knowledge

geometry problem solving neural solver multi-modal fusion geometric knowledge dataset

发现论文，激发创造

Inter-GPS: 可解释的几何问题求解与形式化语言及符号推理

构建了一个大规模的几何问题的数据集，并提出了一种基于形式语言和符号推理的新的解决方案，称为可解释几何问题求解器 (Inter-GPS)，其能够显著提高当前方法的解决几何问题的效果。

May, 2021

LANS: 平面几何问题的布局感知神经求解器

本文提出了一种名为 LANS 的布局感知神经求解器，集成了两个新模块：多模态布局感知预训练语言模型 (MLA-PLM) 和布局感知融合注意力 (LA-FA)，通过全局关系建模和对齐来实现布局感知，并通过布局感知注意力实现点导向的跨模态融合，该求解器在几何数据集上的实验证明了布局感知模块的有效性和超越现有符号求解器和神经求解器的问题求解性能。

Nov, 2023

通过模拟人类双重推理过程学习解决几何问题

提出了一个名为 DualGeoSolver 的双重推理几何求解器，通过模拟人类的双重推理过程，从对人类推理过程和知识应用的显式建模中提高求解几何问题的准确率和鲁棒性。

May, 2024

平面几何图形解析

本文提出了一种基于深度学习和图推理的强大图解析器，通过修改实例分割方法提取几何基元，借助图神经网络（GNN）实现几何关系分析和基元分类，并结合几何特征和先验知识将所有模块集成到名为 PGDPNet 的端到端模型中，该模型实现了所有子任务的高效解决。此外，我们建立了一个名为 PGDP5K 的新的大规模几何图表数据集，进行了实验，并与现有数据集 IMP-Geometry3K 进行比较，发现我们的模型在四个子任务上显着优于现有方法。

May, 2022

GeoQA：一个面向多模态数字推理的几何问答基准

本文提出了大规模的 Geometric Question Answering 数据集 GeoQA 和一个神经几何求解器 NGS，并通过多模式信息综合分析和生成可解释性程序来解决几何问题。

May, 2021

GOLD: 几何问题解决器与自然语言描述

通过分别处理图形符号和几何基元来增强几何关系的提取，并将提取的关系转化为自然语言描述，从而高效利用大型语言模型解决几何数学问题。实验证明，GOLD 模型在 UniGeo 数据集上表现优于 Geoformer，并分别在计算和证明子集中提高了 12.7% 和 42.1% 的准确率。此外，在 PGPS9K 和 Geometry3K 数据集上也优于 PGPSNet，分别获得了 1.8% 和 3.2% 的准确率提升。

May, 2024

FGeo-TP: 几何问题的语言模型增强求解器

应用现代人工智能技术解决几何问题和自动演绎证明一直以来都是数学和人工智能交叉领域的重要挑战。本文提出了一种名为 FGeo-P 的定理预测器，利用语言模型预测几何问题的定理序列，从而提高了解决几何问题的性能，实验证明在 FormalGeo7k 数据集的问题解决率从 39.7% 提升至 80.86%。此外，FGeo-TP 在不同难度问题上表现出了解决时间和搜索步骤显著减少的特点。

Feb, 2024

FGeo-HyperGNet: 几何问题求解正式符号系统与超图神经网络的整合

我们构建了一种神经符号系统，利用神经部分（HyperGNet）根据超树预测定理，并利用符号部分（FormalGeo）应用定理和更新超树，从而形成了一个可追踪的、可读的几何问题自动求解的预测 - 应用循环，实现了 87.65% 的逐步准确率和 85.53% 的总体准确率。

Feb, 2024

GAPS: 几何感知问题求解器

通过提出几何感知问题求解器（GAPS）模型，我们解决了几何问题求解中的挑战，该模型以其独特的问题类型分类器为帮助，生成不同类型几何数学问题的解决方案程序。借助 GAPS 对几何元素进行准确识别的改进，我们展示了其在解决几何数学问题方面的优越性能。在 UniGeo 数据集上的实验证明了 GAPS 模型在计算任务上超过 Geoformer 模型 5.3% 的准确率提升以及在证明任务上惊人的 41.1% 提升，特别是在证明问题上达到令人印象深刻的 97.5% 准确率，为几何证明任务的解决带来了重要进展。

Jan, 2024

G-LLaVA：多模态大型语言模型解决几何问题

利用图像输入，通过理解几何问题，使大型语言模型能够解决几何问题，构建了一个丰富的多模态几何数据集 Geo170K，发展了 G-LLaVA，在 MathVista 基准测试上以仅有 7B 参数显著优于 GPT-4-V。

Dec, 2023