RTHDet:图像中旋转表格区域和头部检测
利用旋转敏感形变注意力来增强 DETR 在面向检测任务中对旋转目标的检测能力,进而提出了旋转物体检测 Transformer(RotaTR)作为 DETR 的扩展模型,相比原始 DETR,在检测密集和旋转对象方面显示出巨大优势,并与现有最先进的模型相比取得了竞争性的结果。
Dec, 2023
本文提出了一种端到端的精调式单阶段旋转物体检测器,通过从粗粒度到细粒度的渐进式回归方法来快速准确检测多角度物体,并设计了特征细化模块和近似 SkewIoU 损失函数以提高检测精度。
Aug, 2019
本文提出了一种一阶段框架 TriDet,用于时间动作检测,其结合了 Trident-head 和 SGP-based 特征金字塔的快速、高效特性,取得了在三个基准测试中的最优性能,表现出优异的时间动作检测结果。
Mar, 2023
本文针对 DET 向有向物体检测的扩展做出首例有力的 DINO 基线,并提出了一种用于缓解重复预测的简单成本和匈牙利匹配的新型去噪策略,该模型的性能在 DOTA-v1.0 /v1.5 /v2.0 和 DIOR-R 基准测试中均达到了最先进水平。
May, 2023
本文提出了一种旋转等变探测器(ReDet),它可以准确地预测方向并且具有巨大的模型尺寸减小,同时在 RoI 对齐上具有旋转不变性。在多个具有挑战性的航空影像数据集上,与以前的最佳结果相比,ReDet 的实验结果更好,同时可以降低 60%的参数(313 Mb 与 121 Mb)。
Mar, 2021
本文提出了一种将角度预测任务从回归问题转变为分类问题的方法,并使用设计的 “圆滑标签” 和 “密集编码标签” 来解决周期性和编码长度过大的问题,在三个大规模公共数据集上进行了实验验证,证明了该方法的有效性。
Mar, 2020
RobusTabNet 是一种新的具有表检测和结构识别功能的方法,可检测表格的边界,并从异构文档图像中重建每个表格的细胞结构。我们提出了使用 CornerNet 作为新的区域提议网络进行表检测,并提出了基于分割和合并的表格结构识别方法。
Mar, 2022
该论文提出了一种用于解决旋转物体检测中表现退化问题的新型调制旋转损失函数,并通过 RSDet 和 RSDet++ 进行了实验验证,实现了在挑战性基准 DOTA1.0、DOTA1.5 和 DOTA2.0 上的竞争结果。
Sep, 2021
本文提出基于 Transformer 的新方法 O²DETR,实现了复杂的有方向物体检测,无需旋转锚点,其性能表现明显优于 Faster R-CNN 和 RetinaNet。
Jun, 2021
本文提出了一种名为旋转敏感回归检测器(RRD)的方法,旨在解决多方向文本探测器中存在的分类问题和面向文本方向的定位问题不相容的问题。该方法通过两个不同设计的网络分支提取具有不同特征的特征,具体地,通过旋转卷积过滤器提取旋转敏感特征的回归分支,通过池化旋转敏感特征提取旋转不变特征的分类分支。该方法在三个面向文本基准数据集上实现了最先进的性能,包括 ICDAR 2015、MSRA-TD500、RCTW-17 和 COCO-Text。并且在船舶收集数据集上对定位面向对象也取得了显著的进展,显示了该方法在面向对象检测方面的普适性。
Mar, 2018