图像文档中的财务表提取
本文介绍了 TableNet—— 一种新颖的端到端深度学习模型,用于识别文档图像中的表格,并提出了一种语义规则的行提取方法,结果表明该模型在两个公开数据集(ICDAR 2013 和 Marmot Table)上都达到了最佳性能,并能通过给模型添加额外的语义特征进行性能提升,同时表明该模型对数据集的迁移学习效果良好。
Jan, 2020
本文提出了 FinTab 数据集,包含 1600 个财务表以及它们在 JSON 表示中的结构,以方便从非结构化数字文件中提取表格。同时,作者还提出了一种基于 GFTE 的图卷积神经网络模型,它将图像特征、位置特征和文本特征集成在一起,用于精确的边缘预测,并取得了总体上不错的结果。
Mar, 2020
本研究提出了一个基于编码器 - 解码器结构的深度学习模型,用于将表格图像转换为 HTML 代码,并使用一种新的基于 Tree-Edit-Distance 相似度(TEDS)度量方法实现表格识别,实验结果表明所提出的模型在复杂表格识别方面具有优秀的表现。
Nov, 2019
在复杂的商务文件中,本文研究了表格检测与提取,提出一种利用单模型提取表格中信息的方法,并使用基于单词框、位置嵌入、可训练文本特征和图形的全面页面表示来解决这个问题。我们建立了一个新的数据集,提供了多种基线方法和新的神经网络模型来解决表格识别问题,并详细分析了图卷积和自注意力对模型性能的影响。
Mar, 2019
通过深度学习模型 ExTTNet,自动从发票图像中提取产品表,使用 OCR 技术从图像中获取文本,并使用特征提取方法来增加准确性。
Feb, 2024
这篇论文介绍了一种名为 DeepReader 的新型企业级综合框架,其通过识别文档图像中的视觉实体并在不同实体之间填充元关系模型来促进文档图像中的信息提取,包括从表格、图表、脚注、文本框和标题等视觉实体中提取相关信息。
Dec, 2018
介绍了一种新的流程 TabIQA,它使用最先进的深度学习技术从图像中提取表格内容和结构信息,能够回答与数字数据、文本信息和结构化表格相关的各种问题,并且在回答与表格相关的问题方面取得了良好的成绩。
Mar, 2023
我们提出了一种端到端的流程,通过集成深度学习模型实现图像中的表格自动识别,解决了表格检测、表格结构识别和表格内容识别的问题,提高了准确性和效率。
Apr, 2024
本研究提出了一种名为 Multi-Type-TD-TSR 的多阶段流水线,可实现表格检测和结构识别的端对端解决方案,利用深度学习模型实现表格检测和区分边框的三种不同类型的表格。在 ICDAR 2019 表格结构识别数据集上进行评估,实现了新的最先进技术。
May, 2021
该研究提出了一种从医学文献中的表格中提取数值和文本信息的方法,包括表格检测、功能处理、结构处理、语义标记、语用处理、单元选择和句法处理等七个步骤,F - 度量值范围在 82% - 92% 之间.
Feb, 2019