Aug, 2019

复杂表格结构识别

TL;DR本论文提出了一种名为 GraphTSR 的新型图神经网络,用于在 PDF 文件中识别表的结构,其通过预测单元之间的关系来识别表结构,并构建了一个大规模的表结构识别数据集 SciTSR,该模型对于复杂的表具有很高效性,并超过了基准数据集和新构建的数据集中的现有模型。