平面几何图形解析
本文提出了一种基于神经网络的解题方案 PGPSNet 来解决几何问题求解中的模态融合问题;通过把图解转化成文本描述来更有效地描述数据特征,并结合结构和语义训练、数据增强和自限制解码等来增强几何理解和推理。此外,还构建了一个新的大规模、细粒度的 PGPS9K 数据库来帮助该领域的研究。我们在 PGPS9K 和 Geometry3K 数据集上的实验验证了该方法的优越性。
Feb, 2023
提出神经架构,输入 2D 或 3D 形状并输出生成形状的程序。程序基于构造实体几何原理,采用循环神经网络以一种自下而上的方式解析输入形状,显著提高了速度和精确性,使用强化学习技术进行训练。
Dec, 2017
构建了一个大规模的几何问题的数据集,并提出了一种基于形式语言和符号推理的新的解决方案,称为可解释几何问题求解器 (Inter-GPS),其能够显著提高当前方法的解决几何问题的效果。
May, 2021
介绍了一种新的 GCPNet 图神经网络,其具有 SE (3) 置换对称性,用于 3D 分子图形表示学习,在蛋白质 - 配体结合亲和力预测,蛋白质结构排序和牛顿多体系统建模任务中均取得了最先进的效果。
Nov, 2022
从历史手稿中自动提取几十万个图表中的几何内容将使历史学家能够在全球范围内研究天文知识的传播。我们提供了一个独特的数据集,包含 303 个来自不同传统的天文图表,从 12 世纪到 18 世纪,注释了 3000 多个线段、圆和弧。我们还开发了一个模型,该模型基于 DINO-DETR,可以预测多个几何基元。我们展示了该模型可以仅通过合成数据进行训练,并准确地预测我们具有挑战性的数据集上的基元。我们的方法在多个基元的意义化参数化、检测和参数细化的联合训练以及使用丰富的合成数据进行训练方面明显改进了 LETR 基准。我们的数据集和代码可在我们的网页上获取。
Mar, 2024
通过分别处理图形符号和几何基元来增强几何关系的提取,并将提取的关系转化为自然语言描述,从而高效利用大型语言模型解决几何数学问题。实验证明,GOLD 模型在 UniGeo 数据集上表现优于 Geoformer,并分别在计算和证明子集中提高了 12.7% 和 42.1% 的准确率。此外,在 PGPS9K 和 Geometry3K 数据集上也优于 PGPSNet,分别获得了 1.8% 和 3.2% 的准确率提升。
May, 2024
本论文提出了一种基于 Part Grouping Network 的多人解析方法,通过二元子任务实现语义部分分割与实例感知边缘检测,并在多个数据集上实现了优于当前状态 of-the-art 的表现。
Aug, 2018
本研究提出了一种名为 Hierarchical Long Short-Term Memory(H-LSTM)的循环神经网络模型,它包含两个耦合子网络,即 Pixel LSTM 和 Multi-scale Super-pixel LSTM,用于处理表面标记和关系预测,分别提供补充信息以利用分层场景上下文,联合优化以提高性能,并能在几何场景中解析场景几何结构,并且具有优秀的 3D 重建结果。
Apr, 2016
提出了一个名为 DualGeoSolver 的双重推理几何求解器,通过模拟人类的双重推理过程,从对人类推理过程和知识应用的显式建模中提高求解几何问题的准确率和鲁棒性。
May, 2024