Feb, 2023

多模态神经几何求解器:从图解析文本子句

TL;DR本文提出了一种基于神经网络的解题方案 PGPSNet 来解决几何问题求解中的模态融合问题;通过把图解转化成文本描述来更有效地描述数据特征,并结合结构和语义训练、数据增强和自限制解码等来增强几何理解和推理。此外,还构建了一个新的大规模、细粒度的 PGPS9K 数据库来帮助该领域的研究。我们在 PGPS9K 和 Geometry3K 数据集上的实验验证了该方法的优越性。