使用检测变形器作为数据增广器
本研究针对小物体检测中 RT-DETR 模型的准确性不足提出了两个关键改进:首先,引入细粒度路径增强方法以提供更多详细信息来精确定位小物体;其次,采用自适应特征融合算法来有效整合不同尺度的特征信息,从而提高模型对不同尺度目标的检测准确率。
Jan, 2024
该研究提出了一种新方法,将目标检测作为直接集合预测问题进行处理,主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型,能够高效地完成目标检测和全景分割任务,相较于许多现代检测器,DETR 模型概念简单且不需要专门的库。
May, 2020
设计了 DA-DETR,一种域自适应物体检测变压器,引入信息融合以实现从一个带标记的源域到一个未标记的目标域的有效传输,并采用 CTBlender 对卷积神经网络特征和变换器特征进行聚合。在多个广泛采用的域自适应基准测试中,DA-DETR 不断实现卓越的检测性能。
Mar, 2021
本研究探讨了使用 DEtection TRansformer(DETR)检测医学成像中可疑区域的可行性,研究表明这种方法能够与甚至优于当前方法进行匹配,且无需依赖锚点或手动启发式设计等方式来检测对象。
Jun, 2023
本研究提出了一种名为随机查询块检测的预训练任务 (UP-DETR),通过多查询本地化技术和注意力掩码来将其从单一查询块推广到多查询块,提高了检测性能和收敛速度。
Nov, 2020
Deformable DETR 提出了一种改进的 Transformer 注意力模块,只关注于围绕参考点的一小集采样点,能够更好地实现物体检测,尤其是在小物体上,并在 COCO 基准测试上得到了有效的实验结果。
Oct, 2020
本文提出了一种名为 TokenMix 的数据增强技术,它在令牌级别上混合两个图像,通过将混合区域分区成多个独立的部分来实现,其适用于更好地训练视觉变换器,同时根据预训练的 teacher 模型的内容基础神经激活映射分配目标分数,增强了其稳健性和性能。
Jul, 2022
基于 Transformer 的目标检测器 (DETR) 在机器视觉任务中表现出显著性能,但其在处理遮挡和对抗扰动等不同图像干扰方面存在问题。我们通过多种实验和将 DETR 与基于卷积神经网络 (CNN) 的检测器(如 YOLO 和 Faster-RCNN)进行基准测试来研究这个问题。我们发现 DETR 在处理遮挡图像的信息丢失干扰方面表现良好。然而,在涂有对抗标记的图像上,网络需要产生一组新的不必要的键、查询和值,导致网络方向错误。与图像损坏基准测试中 YOLOv5 相比,DETR 的性能也较差。此外,我们发现 DETR 在进行预测时严重依赖于主要查询,导致查询之间的贡献不平衡,因为主要查询接收大部分梯度流。
Oct, 2023
通过引入实例级对比损失、修订的采样策略和轻量级分配方法,我们展示了如何将 DETR 转化为 MOT 模型,学习目标的外观并保留检测能力,其性能在具有挑战性的 BDD100K 数据集上超过了先前的最新技术水平 2.6 mMOTA,并在 MOT17 数据集上与现有的基于 transformer 的方法相媲美。
Nov, 2023
我们提出了 Semi-DETR,一个基于 transformer 的端到端半监督物体检测器,通过阶段混合匹配策略、跨视图查询一致性方法和基于代价的伪标签挖掘模块解决 DETR 中存在的问题,并在 COCO 和 Pascal VOC 基准数据集上的所有 SSOD 设置中进行的实验表明,我们的方法优于所有现有方法。
Jul, 2023