基于可变形变换器的端到端半监督表格检测

May, 2023

基于可变形变换器的端到端半监督表格检测

Towards End-to-End Semi-Supervised Table Detection with Deformable Transformer

Tahira Shehzadi, Khurram Azeem Hashmi, Didier Stricker, Marcus Liwicki, Muhammad Zeshan Afzal

TL;DR本论文提出了一种新的端到端半监督表格检测方法，采用可变形转换器。在 PubLayNet、DocBank、ICADR-19 和 TableBank 数据集上评估了该方法，相较于之前的方法表现更出色。

Abstract

table detection is the task of classifying and localizing table objects within document images. With the recent development in deep learning

table detection deep learning semi-supervised deformable transformer document images

发现论文，激发创造

适用于文档中的表格检测的调制物体查询的端到端半监督方法

本研究提出了一种创新的基于 Transformer 的半监督表格检测器，通过结合一对一和一对多分配技术的新型匹配策略提高了伪标签质量，在早期阶段显著提高了训练效率，进而确保了更好的伪标签进行进一步训练。该方法在多个基准数据集上进行了全面评估，包括 PubLayNet、ICADR-19 和 TableBank，在 TableBank 和 PubLaynet 数据集上以 30％标签数据实现了 95.7％和 97.9％的 mAP，较之前的半监督表格检测方法分别提升了 7.4 和 7.6 个百分点，结果明确展示了该方法的卓越性能，大幅超过现有所有先进方法。该研究在半监督表格检测方法方面取得了重要进展，为实际文档分析任务提供了更高效准确的解决方案。

May, 2024

朝着端到端的半监督表格检测与语义对齐匹配转换器

通过 SAM-DETR 引入半监督方法，实现了目标查询和目标特征之间的精确对齐，从而在表的识别方面显著降低了误报率，并在复杂文档中表现出较高的性能，提供了更加高效准确的表格检测。

Apr, 2024

TableFormer: 基于 Transformer 的表格结构理解

本文提出了一种新的表格结构识别模型，通过引入新的对象检测解码器和基于 transformer 的解码器，能够更准确地提取表格内容并处理各种形式的表格。

Mar, 2022

TableNet: 一种深度学习模型，用于从扫描文档图像中端到端地检测表格并提取表格数据

本文介绍了 TableNet—— 一种新颖的端到端深度学习模型，用于识别文档图像中的表格，并提出了一种语义规则的行提取方法，结果表明该模型在两个公开数据集（ICDAR 2013 和 Marmot Table）上都达到了最佳性能，并能通过给模型添加额外的语义特征进行性能提升，同时表明该模型对数据集的迁移学习效果良好。

Jan, 2020

ClusterTabNet：用于表格检测和表格结构识别的有监督聚类方法

我们提出了一种新颖的基于深度学习的方法来对文档中的单词进行聚类，并应用于检测和识别 OCR 输出中的表格。我们将表的结构从底部向上解释为单词之间的关系图（属于同一行，列，标题以及同一张表），并使用 Transformer 编码器模型来预测其邻接矩阵。我们在 PubTables-1M 数据集以及 PubTabNet 和 FinTabNet 数据集上展示了我们方法的性能。与当前的最先进的检测方法如 DETR 和 Faster R-CNN 相比，我们的方法在精度上达到了类似或更好的结果，并且要求更小的模型。

Feb, 2024

异构文档图像中的鲁棒表格检测和结构识别

RobusTabNet 是一种新的具有表检测和结构识别功能的方法，可检测表格的边界，并从异构文档图像中重建每个表格的细胞结构。我们提出了使用 CornerNet 作为新的区域提议网络进行表检测，并提出了基于分割和合并的表格结构识别方法。

Mar, 2022

目标检测的少标注学习：基于 Transformer 模型是否更高效？

在这篇文章中，我们针对当前最先进的目标检测器 Deformable DETR，提出了一种针对少批注学习设置的半监督方法，使用学生 - 教师架构，在避免依赖教师模型生成的伪标签的敏感后处理的同时进行学习。我们在半监督目标检测基准 COCO 和 Pascal VOC 上评估了我们的方法，并在标注稀缺的情况下优于先前的方法。我们相信我们的贡献为在此设置中使用类似的目标检测方法开辟了新的可能性。

Oct, 2023

CascadeTabNet：一种端到端的基于图像文档的表格检测和结构识别方法

本篇论文提出使用单个深度卷积神经网络（CNN）模型的改进型深度学习端到端方法：CascadeTabNet，用于解决表格检测和结构识别的两个问题，并通过有效的迁移学习和图像增强技术在 ICDAR 2013、ICDAR 2019 和 TableBank 数据集上达到了最佳结果。

Apr, 2020

软教师端到端半监督目标检测

本文提出了一种半监督的端到端目标检测方法，采用渐进的端到端训练来提高伪标签的质量，并在 COCO 基准测试中通过采用两种简单而有效的技术进行了改进，使得在不同的标记比率下（1%，5% 和 10%）皆性能优于以往方法，并且在有大量标记数据的情况下也表现良好。

Jun, 2021

在文档图像中，弥合 DETR 和 R-CNN 之间图形物体检测性能差距

通过对目标查询进行修改，将现有的检测变压器应用于图像对象检测，提高了其性能，并在四个数据集上获得了新的最先进结果。

Jun, 2023