结构化文档中的表格理解
本文介绍了 TableNet—— 一种新颖的端到端深度学习模型,用于识别文档图像中的表格,并提出了一种语义规则的行提取方法,结果表明该模型在两个公开数据集(ICDAR 2013 和 Marmot Table)上都达到了最佳性能,并能通过给模型添加额外的语义特征进行性能提升,同时表明该模型对数据集的迁移学习效果良好。
Jan, 2020
本文提出了一种基于深度学习的方法,它首先对表格图像进行预处理,然后将其输入到具有门控循环单元(GRU)的双向循环神经网络中,最终将结果分类为行分隔符或列分隔符。该方法在表格结构提取方面取得了显著的性能提升。
Jan, 2020
本文提供了一种基于 Transformer 的科学表格结构和内容提取方法,能够解决 PDF 研究文档中存在的跨度单元格和公式等复杂因素,最终精确匹配表格结构和内容,并高效识别表格的各种特征。
Oct, 2022
本文提出一种基于图网络架构的表格识别方法,在视觉特征提取方面融合了卷积神经网络的优势;实验证明该方法优于基准线方法。此外,为了解决大规模数据集问题,文中提出了一种合成数据集,并开源了数据集生成及图网络训练框架,以推进研究的可复制性。
May, 2019
本文提出了一种新的表格结构识别模型,通过引入新的对象检测解码器和基于 transformer 的解码器,能够更准确地提取表格内容并处理各种形式的表格。
Mar, 2022
本文提出了一个算法,使用局部阈值进行单词间距和行高度来提取扫描文档图像中的所有类别的表格,并在 298 个文档上进行了实验,发现算法在检测扫描文档图像中的表格方面具有约 75% 的总体准确度。
Dec, 2014
该研究提出了一种从医学文献中的表格中提取数值和文本信息的方法,包括表格检测、功能处理、结构处理、语义标记、语用处理、单元选择和句法处理等七个步骤,F - 度量值范围在 82% - 92% 之间.
Feb, 2019
本研究提出了一个基于编码器 - 解码器结构的深度学习模型,用于将表格图像转换为 HTML 代码,并使用一种新的基于 Tree-Edit-Distance 相似度(TEDS)度量方法实现表格识别,实验结果表明所提出的模型在复杂表格识别方面具有优秀的表现。
Nov, 2019
本研究提出了一种识别具有复杂结构,密集内容和不同布局的表格的方法,其不依赖于元特征和 OCR,并结合单元检测和交互模块来本地化细胞并预测它们与其他检测到的单元的行和列关联,同时将结构约束作为细胞检测损失函数的附加差分组件,从而将自上而下和自下而上的线索结合在一起,实现对表格的视觉理解
Oct, 2020