TRACE:基于角落和边缘对齐的表格重构
本论文提出了一种名为GraphTSR的新型图神经网络,用于在PDF文件中识别表的结构,其通过预测单元之间的关系来识别表结构,并构建了一个大规模的表结构识别数据集SciTSR,该模型对于复杂的表具有很高效性,并超过了基准数据集和新构建的数据集中的现有模型。
Aug, 2019
本研究提出了一种识别具有复杂结构,密集内容和不同布局的表格的方法,其不依赖于元特征和OCR,并结合单元检测和交互模块来本地化细胞并预测它们与其他检测到的单元的行和列关联,同时将结构约束作为细胞检测损失函数的附加差分组件,从而将自上而下和自下而上的线索结合在一起,实现对表格的视觉理解
Oct, 2020
本研究提出了一种名为Multi-Type-TD-TSR的多阶段流水线,可实现表格检测和结构识别的端对端解决方案,利用深度学习模型实现表格检测和区分边框的三种不同类型的表格。在ICDAR 2019表格结构识别数据集上进行评估,实现了新的最先进技术。
May, 2021
RobusTabNet是一种新的具有表检测和结构识别功能的方法,可检测表格的边界,并从异构文档图像中重建每个表格的细胞结构。我们提出了使用CornerNet作为新的区域提议网络进行表检测,并提出了基于分割和合并的表格结构识别方法。
Mar, 2022
提出了一种名为TSRFormer的新的表格结构识别方法,使用线性回归问题而不是图像分割问题来预测表格的分隔线,并提出了新的两阶段DETR分隔线预测方法来直接从表图像中预测分隔线。使用新的技术后,我们的TSRFormer在几个基准数据集上都获得了最先进的表现。
Aug, 2022
将无结构的表格图像转换为HTML序列的表结构识别(TSR)任务经常遇到这样的挑战,并发现现有的基于检测的解决方案存在一些限制,因此比较了两阶段和基于Transformer的检测模型,明确了成功的两阶段检测模型的关键设计方面,包括多类问题定义、锚框生成的纵横比和骨干网络的特征生成。通过改进Cascade R-CNN模型的这些方面,并应用简单的方法,实现了在SciTSR、FinTabNet和PubTables1M数据集上针对结构TEDS的最新性能提升,分别达到19.32%、11.56%和14.77%。
Dec, 2023
我们提出了一个名为LORE的新的TSR框架,它以逻辑位置回归问题为模型,通过在统一网络中回归表格单元的逻辑位置和空间位置来解决表格结构识别问题。我们进一步提出了两个预训练任务来丰富LORE在特征层面的空间和逻辑表示,形成升级版的LORE++,它在准确性、泛化能力和少样本能力方面相较于前身有了显著的提升。通过对以往TSR范式方法在标准基准数据集上的实验,我们证明了LORE++的优越性,彰显了逻辑位置回归范式在TSR中的潜力和前景。
Jan, 2024
我们提出了一种端到端的流程,通过集成深度学习模型实现图像中的表格自动识别,解决了表格检测、表格结构识别和表格内容识别的问题,提高了准确性和效率。
Apr, 2024
基于“拆分和合并”范式,本文提出了SEMv3方法,它通过引入Keypoint Offset Regression (KOR)模块在拆分阶段有效地检测表格分割线,并在合并阶段定义了一系列合并操作来高效描述表格结构。大量消融实验表明,我们提出的KOR模块能够快速准确地检测表格分割线,并在公开数据集上达到了最先进的性能。
May, 2024