基于可变形变换器的端到端半监督表格检测
本研究提出了一种创新的基于 Transformer 的半监督表格检测器,通过结合一对一和一对多分配技术的新型匹配策略提高了伪标签质量,在早期阶段显著提高了训练效率,进而确保了更好的伪标签进行进一步训练。该方法在多个基准数据集上进行了全面评估,包括 PubLayNet、ICADR-19 和 TableBank,在 TableBank 和 PubLaynet 数据集上以 30%标签数据实现了 95.7%和 97.9%的 mAP,较之前的半监督表格检测方法分别提升了 7.4 和 7.6 个百分点,结果明确展示了该方法的卓越性能,大幅超过现有所有先进方法。该研究在半监督表格检测方法方面取得了重要进展,为实际文档分析任务提供了更高效准确的解决方案。
May, 2024
通过 SAM-DETR 引入半监督方法,实现了目标查询和目标特征之间的精确对齐,从而在表的识别方面显著降低了误报率,并在复杂文档中表现出较高的性能,提供了更加高效准确的表格检测。
Apr, 2024
本文提出了一种新的表格结构识别模型,通过引入新的对象检测解码器和基于 transformer 的解码器,能够更准确地提取表格内容并处理各种形式的表格。
Mar, 2022
本文介绍了 TableNet—— 一种新颖的端到端深度学习模型,用于识别文档图像中的表格,并提出了一种语义规则的行提取方法,结果表明该模型在两个公开数据集(ICDAR 2013 和 Marmot Table)上都达到了最佳性能,并能通过给模型添加额外的语义特征进行性能提升,同时表明该模型对数据集的迁移学习效果良好。
Jan, 2020
我们提出了一种新颖的基于深度学习的方法来对文档中的单词进行聚类, 并应用于检测和识别 OCR 输出中的表格。我们将表的结构从底部向上解释为单词之间的关系图(属于同一行,列,标题以及同一张表),并使用 Transformer 编码器模型来预测其邻接矩阵。我们在 PubTables-1M 数据集以及 PubTabNet 和 FinTabNet 数据集上展示了我们方法的性能。与当前的最先进的检测方法如 DETR 和 Faster R-CNN 相比,我们的方法在精度上达到了类似或更好的结果,并且要求更小的模型。
Feb, 2024
RobusTabNet 是一种新的具有表检测和结构识别功能的方法,可检测表格的边界,并从异构文档图像中重建每个表格的细胞结构。我们提出了使用 CornerNet 作为新的区域提议网络进行表检测,并提出了基于分割和合并的表格结构识别方法。
Mar, 2022
在这篇文章中,我们针对当前最先进的目标检测器 Deformable DETR,提出了一种针对少批注学习设置的半监督方法,使用学生 - 教师架构,在避免依赖教师模型生成的伪标签的敏感后处理的同时进行学习。我们在半监督目标检测基准 COCO 和 Pascal VOC 上评估了我们的方法,并在标注稀缺的情况下优于先前的方法。我们相信我们的贡献为在此设置中使用类似的目标检测方法开辟了新的可能性。
Oct, 2023
本篇论文提出使用单个深度卷积神经网络(CNN)模型的改进型深度学习端到端方法:CascadeTabNet,用于解决表格检测和结构识别的两个问题,并通过有效的迁移学习和图像增强技术在 ICDAR 2013、ICDAR 2019 和 TableBank 数据集上达到了最佳结果。
Apr, 2020
本文提出了一种半监督的端到端目标检测方法,采用渐进的端到端训练来提高伪标签的质量,并在 COCO 基准测试中通过采用两种简单而有效的技术进行了改进,使得在不同的标记比率下(1%,5% 和 10%)皆性能优于以往方法,并且在有大量标记数据的情况下也表现良好。
Jun, 2021
通过对目标查询进行修改,将现有的检测变压器应用于图像对象检测,提高了其性能,并在四个数据集上获得了新的最先进结果。
Jun, 2023