图像文档中的财务表提取

Mar, 2024

Financial Table Extraction in Image Documents

William Watson, Bo Liu

TL;DR本文提出了一个端到端的流水线，用于在图像文档中识别、提取和转录表格内容，同时保留高保真度的原始空间关系。

Abstract

table extraction has long been a pervasive problem in financial services. This is more challenging in the image domain, where content is l

table extraction financial services image domain deep learning ocr

发现论文，激发创造

TableNet: 一种深度学习模型，用于从扫描文档图像中端到端地检测表格并提取表格数据

本文介绍了 TableNet—— 一种新颖的端到端深度学习模型，用于识别文档图像中的表格，并提出了一种语义规则的行提取方法，结果表明该模型在两个公开数据集（ICDAR 2013 和 Marmot Table）上都达到了最佳性能，并能通过给模型添加额外的语义特征进行性能提升，同时表明该模型对数据集的迁移学习效果良好。

Jan, 2020

基于图的财务报表提取

本文提出了 FinTab 数据集，包含 1600 个财务表以及它们在 JSON 表示中的结构，以方便从非结构化数字文件中提取表格。同时，作者还提出了一种基于 GFTE 的图卷积神经网络模型，它将图像特征、位置特征和文本特征集成在一起，用于精确的边缘预测，并取得了总体上不错的结果。

Mar, 2020

基于图像的表格识别：数据、模型和评估

本研究提出了一个基于编码器 - 解码器结构的深度学习模型，用于将表格图像转换为 HTML 代码，并使用一种新的基于 Tree-Edit-Distance 相似度（TEDS）度量方法实现表格识别，实验结果表明所提出的模型在复杂表格识别方面具有优秀的表现。

Nov, 2019

结构化文档中的表格理解

在复杂的商务文件中，本文研究了表格检测与提取，提出一种利用单模型提取表格中信息的方法，并使用基于单词框、位置嵌入、可训练文本特征和图形的全面页面表示来解决这个问题。我们建立了一个新的数据集，提供了多种基线方法和新的神经网络模型来解决表格识别问题，并详细分析了图卷积和自注意力对模型性能的影响。

Mar, 2019

ExTTNet：从发票图像中提取表格文本的深度学习算法

通过深度学习模型 ExTTNet，自动从发票图像中提取产品表，使用 OCR 技术从图像中获取文本，并使用特征提取方法来增加准确性。

Feb, 2024

深度阅读器：通过关系抽取和自然语言从文档图像中提取信息

这篇论文介绍了一种名为 DeepReader 的新型企业级综合框架，其通过识别文档图像中的视觉实体并在不同实体之间填充元关系模型来促进文档图像中的信息提取，包括从表格、图表、脚注、文本框和标题等视觉实体中提取相关信息。

Dec, 2018

TabIQA：企业文档图像中针对表格的问答

介绍了一种新的流程 TabIQA，它使用最先进的深度学习技术从图像中提取表格内容和结构信息，能够回答与数字数据、文本信息和结构化表格相关的各种问题，并且在回答与表格相关的问题方面取得了良好的成绩。

Mar, 2023

TC-OCR：高效检测与识别表格结构和内容的 TableCraft OCR

我们提出了一种端到端的流程，通过集成深度学习模型实现图像中的表格自动识别，解决了表格检测、表格结构识别和表格内容识别的问题，提高了准确性和效率。

Apr, 2024

使用多阶段流程进行表格检测和表格结构识别的多类型 TD-TSR —— 从 OCR 到结构化表格表示中提取文档图像的表格

本研究提出了一种名为 Multi-Type-TD-TSR 的多阶段流水线，可实现表格检测和结构识别的端对端解决方案，利用深度学习模型实现表格检测和区分边框的三种不同类型的表格。在 ICDAR 2019 表格结构识别数据集上进行评估，实现了新的最先进技术。

May, 2021

医学文献中表格信息提取框架

该研究提出了一种从医学文献中的表格中提取数值和文本信息的方法，包括表格检测、功能处理、结构处理、语义标记、语用处理、单元选择和句法处理等七个步骤，F - 度量值范围在 82% - 92% 之间.

Feb, 2019