平面几何图形解析

IJCAIMay, 2022

Plane Geometry Diagram Parsing

Ming-Liang Zhang, Fei Yin, Yi-Han Hao, Cheng-Lin Liu

TL;DR本文提出了一种基于深度学习和图推理的强大图解析器，通过修改实例分割方法提取几何基元，借助图神经网络（GNN）实现几何关系分析和基元分类，并结合几何特征和先验知识将所有模块集成到名为 PGDPNet 的端到端模型中，该模型实现了所有子任务的高效解决。此外，我们建立了一个名为 PGDP5K 的新的大规模几何图表数据集，进行了实验，并与现有数据集 IMP-Geometry3K 进行比较，发现我们的模型在四个子任务上显着优于现有方法。

Abstract

geometry diagram parsing plays a key role in geometry problem solving, wherein the primitive extraction and relation parsing remain challenging due to the complex layout and between-primitive relationship. In this paper, we propose a powerful diagram parser based on →

geometry diagram parsing deep learning graph reasoning instance segmentation graph neural network

发现论文，激发创造

多模态神经几何求解器：从图解析文本子句

本文提出了一种基于神经网络的解题方案 PGPSNet 来解决几何问题求解中的模态融合问题；通过把图解转化成文本描述来更有效地描述数据特征，并结合结构和语义训练、数据增强和自限制解码等来增强几何理解和推理。此外，还构建了一个新的大规模、细粒度的 PGPS9K 数据库来帮助该领域的研究。我们在 PGPS9K 和 Geometry3K 数据集上的实验验证了该方法的优越性。

Feb, 2023

CSGNet: 基于神经网络的构造实体几何形状解析器

提出神经架构，输入 2D 或 3D 形状并输出生成形状的程序。程序基于构造实体几何原理，采用循环神经网络以一种自下而上的方式解析输入形状，显著提高了速度和精确性，使用强化学习技术进行训练。

Dec, 2017

Inter-GPS: 可解释的几何问题求解与形式化语言及符号推理

构建了一个大规模的几何问题的数据集，并提出了一种基于形式语言和符号推理的新的解决方案，称为可解释几何问题求解器 (Inter-GPS)，其能够显著提高当前方法的解决几何问题的效果。

May, 2021

三维分子图形的几何完整感知机网络

介绍了一种新的 GCPNet 图神经网络，其具有 SE (3) 置换对称性，用于 3D 分子图形表示学习，在蛋白质 - 配体结合亲和力预测，蛋白质结构排序和牛顿多体系统建模任务中均取得了最先进的效果。

Nov, 2022

历史天文图解的几何基元分解

从历史手稿中自动提取几十万个图表中的几何内容将使历史学家能够在全球范围内研究天文知识的传播。我们提供了一个独特的数据集，包含 303 个来自不同传统的天文图表，从 12 世纪到 18 世纪，注释了 3000 多个线段、圆和弧。我们还开发了一个模型，该模型基于 DINO-DETR，可以预测多个几何基元。我们展示了该模型可以仅通过合成数据进行训练，并准确地预测我们具有挑战性的数据集上的基元。我们的方法在多个基元的意义化参数化、检测和参数细化的联合训练以及使用丰富的合成数据进行训练方面明显改进了 LETR 基准。我们的数据集和代码可在我们的网页上获取。

Mar, 2024

一个图表胜过一打图片

本文提出了一种基于 DPG 表示的图表结构模型，探究了图表的句法分析学习与语义解释推理等问题，并在 5000 多张图表的数据集上验证了该模型的有效性。

Mar, 2016

GOLD: 几何问题解决器与自然语言描述

通过分别处理图形符号和几何基元来增强几何关系的提取，并将提取的关系转化为自然语言描述，从而高效利用大型语言模型解决几何数学问题。实验证明，GOLD 模型在 UniGeo 数据集上表现优于 Geoformer，并分别在计算和证明子集中提高了 12.7% 和 42.1% 的准确率。此外，在 PGPS9K 和 Geometry3K 数据集上也优于 PGPSNet，分别获得了 1.8% 和 3.2% 的准确率提升。

May, 2024

基于部件分组网络的实例级人体部位划分

本论文提出了一种基于 Part Grouping Network 的多人解析方法，通过二元子任务实现语义部分分割与实例感知边缘检测，并在多个数据集上实现了优于当前状态 of-the-art 的表现。

Aug, 2018

层次 LSTM 几何场景解析

本研究提出了一种名为 Hierarchical Long Short-Term Memory（H-LSTM）的循环神经网络模型，它包含两个耦合子网络，即 Pixel LSTM 和 Multi-scale Super-pixel LSTM，用于处理表面标记和关系预测，分别提供补充信息以利用分层场景上下文，联合优化以提高性能，并能在几何场景中解析场景几何结构，并且具有优秀的 3D 重建结果。

Apr, 2016

通过模拟人类双重推理过程学习解决几何问题

提出了一个名为 DualGeoSolver 的双重推理几何求解器，通过模拟人类的双重推理过程，从对人类推理过程和知识应用的显式建模中提高求解几何问题的准确率和鲁棒性。

May, 2024