结构化文档中的表格理解

MMMar, 2019

Table understanding in structured documents

Martin Holeček, Antonín Hoskovec, Petr Baudiš, Pavel Klinger

TL;DR在复杂的商务文件中，本文研究了表格检测与提取，提出一种利用单模型提取表格中信息的方法，并使用基于单词框、位置嵌入、可训练文本特征和图形的全面页面表示来解决这个问题。我们建立了一个新的数据集，提供了多种基线方法和新的神经网络模型来解决表格识别问题，并详细分析了图卷积和自注意力对模型性能的影响。

Abstract

Abstract--- table detection and extraction has been studied in the context of documents like reports, where tables are clearly outlined and stand out from the document structure visually. We study this topic in a rather more challenging domain of →

table detection layout-heavy business documents graph over word boxes neural network model invoices

发现论文，激发创造

TableNet: 一种深度学习模型，用于从扫描文档图像中端到端地检测表格并提取表格数据

本文介绍了 TableNet—— 一种新颖的端到端深度学习模型，用于识别文档图像中的表格，并提出了一种语义规则的行提取方法，结果表明该模型在两个公开数据集（ICDAR 2013 和 Marmot Table）上都达到了最佳性能，并能通过给模型添加额外的语义特征进行性能提升，同时表明该模型对数据集的迁移学习效果良好。

Jan, 2020

使用双向门控循环单元网络进行表格结构提取

本文提出了一种基于深度学习的方法，它首先对表格图像进行预处理，然后将其输入到具有门控循环单元（GRU）的双向循环神经网络中，最终将结果分类为行分隔符或列分隔符。该方法在表格结构提取方面取得了显著的性能提升。

Jan, 2020

科学表格格式和内容提取到 LaTeX

本文提供了一种基于 Transformer 的科学表格结构和内容提取方法，能够解决 PDF 研究文档中存在的跨度单元格和公式等复杂因素，最终精确匹配表格结构和内容，并高效识别表格的各种特征。

Oct, 2022

使用图神经网络重新思考表格识别

本文提出一种基于图网络架构的表格识别方法，在视觉特征提取方面融合了卷积神经网络的优势；实验证明该方法优于基准线方法。此外，为了解决大规模数据集问题，文中提出了一种合成数据集，并开源了数据集生成及图网络训练框架，以推进研究的可复制性。

May, 2019

TableFormer: 基于 Transformer 的表格结构理解

本文提出了一种新的表格结构识别模型，通过引入新的对象检测解码器和基于 transformer 的解码器，能够更准确地提取表格内容并处理各种形式的表格。

Mar, 2022

图像文档中的财务表提取

本文提出了一个端到端的流水线，用于在图像文档中识别、提取和转录表格内容，同时保留高保真度的原始空间关系。

Mar, 2024

扫描文档表格定位的重建与再出版 (ICIAfS14)

本文提出了一个算法，使用局部阈值进行单词间距和行高度来提取扫描文档图像中的所有类别的表格，并在 298 个文档上进行了实验，发现算法在检测扫描文档图像中的表格方面具有约 75% 的总体准确度。

Dec, 2014

医学文献中表格信息提取框架

该研究提出了一种从医学文献中的表格中提取数值和文本信息的方法，包括表格检测、功能处理、结构处理、语义标记、语用处理、单元选择和句法处理等七个步骤，F - 度量值范围在 82% - 92% 之间.

Feb, 2019

基于图像的表格识别：数据、模型和评估

本研究提出了一个基于编码器 - 解码器结构的深度学习模型，用于将表格图像转换为 HTML 代码，并使用一种新的基于 Tree-Edit-Distance 相似度（TEDS）度量方法实现表格识别，实验结果表明所提出的模型在复杂表格识别方面具有优秀的表现。

Nov, 2019

使用自上而下和自下而上线索的表格结构识别

本研究提出了一种识别具有复杂结构，密集内容和不同布局的表格的方法，其不依赖于元特征和 OCR，并结合单元检测和交互模块来本地化细胞并预测它们与其他检测到的单元的行和列关联，同时将结构约束作为细胞检测损失函数的附加差分组件，从而将自上而下和自下而上的线索结合在一起，实现对表格的视觉理解

Oct, 2020