基于图像的表格识别:数据、模型和评估
本文介绍了 TableNet—— 一种新颖的端到端深度学习模型,用于识别文档图像中的表格,并提出了一种语义规则的行提取方法,结果表明该模型在两个公开数据集(ICDAR 2013 和 Marmot Table)上都达到了最佳性能,并能通过给模型添加额外的语义特征进行性能提升,同时表明该模型对数据集的迁移学习效果良好。
Jan, 2020
本文提出了一种新的表格结构识别模型,通过引入新的对象检测解码器和基于 transformer 的解码器,能够更准确地提取表格内容并处理各种形式的表格。
Mar, 2022
表格识别是使用计算机自动理解表格,从文档或图片中检测表格位置并正确提取和识别表格的内部结构和内容。本文从数据集、表格识别模型、端到端方法、数据增强和表单识别等方面综述了表格识别问题,并总结和比较了该领域的实验数据,分析了主流和更有优势的方法。最后,还讨论了未来表格处理的可能发展方向和趋势,为表格识别领域的研究者提供了一些思路。
Dec, 2023
RobusTabNet 是一种新的具有表检测和结构识别功能的方法,可检测表格的边界,并从异构文档图像中重建每个表格的细胞结构。我们提出了使用 CornerNet 作为新的区域提议网络进行表检测,并提出了基于分割和合并的表格结构识别方法。
Mar, 2022
我们提出了一种端到端的流程,通过集成深度学习模型实现图像中的表格自动识别,解决了表格检测、表格结构识别和表格内容识别的问题,提高了准确性和效率。
Apr, 2024
本文介绍了我们参加 ICDAR 2021 科学文献解析任务 B 的解决方案,其中我们将表格内容识别任务分解为四个子任务:表格结构识别,文本行检测,文本行识别和框分配。我们的方法在开发阶段的 9,115 个样本上实现了 96.84%的 TEDS 分数,在最终评估阶段的 9,064 个样本中实现了 96.32%的 TEDS 分数,表明我们的方法在表格识别方面达到了很好的效果。
May, 2021
本研究针对表格结构推断和从非结构化文件中提取数据的机器学习问题,提出了一种新的数据集 PubTables-1M,并通过使用一种新颖的规范化程序来解决之前数据集中出现的一个重要问题 —— 过度分割,发现这些改进导致训练性能显着提高,表结构识别的可靠性评估也更加可信,最终会对对象检测产生积极影响。
Sep, 2021
我们提出了一种新颖的基于深度学习的方法来对文档中的单词进行聚类, 并应用于检测和识别 OCR 输出中的表格。我们将表的结构从底部向上解释为单词之间的关系图(属于同一行,列,标题以及同一张表),并使用 Transformer 编码器模型来预测其邻接矩阵。我们在 PubTables-1M 数据集以及 PubTabNet 和 FinTabNet 数据集上展示了我们方法的性能。与当前的最先进的检测方法如 DETR 和 Faster R-CNN 相比,我们的方法在精度上达到了类似或更好的结果,并且要求更小的模型。
Feb, 2024
TableBank 使用 Word 和 Latex 文档的弱监督,构建了一个新的基于图像的表格检测和识别数据集。该数据集包含 417K 个高质量标记的表格,并利用深度神经网络构建了多个强基线模型,旨在为表格检测和识别任务提供更多的深度学习方法。
Mar, 2019
本文提出了一种新的数据集 Open-Tables 和 ICT-TD,利用领域专家指导手动注释,清理了现有数据集中的噪声,并将注释定义进行了统一,结果表明这些新数据集更适合交叉领域设置,可提供高质量和一致性注释,更可靠地进行模型评估。
May, 2023