Aug, 2023

文档布局分析的图形方法

TL;DR文档布局分析是检测文档中不同的语义内容并正确分类到适当类别(如文本、标题、图表)的任务。本研究采用基于图的布局分析模型(GLAM),将每个 PDF 页面表示为结构化图,并将布局分析问题作为图分割和分类问题进行。与现有模型相比,GLAM 既能在两个具有挑战性的数据集上与现有模型相媲美,又比现有模型小一个数量级。