基于 DETR 的分层服装分割和细粒度属性识别

Apr, 2023

基于 DETR 的分层服装分割和细粒度属性识别

DETR-based Layered Clothing Segmentation and Fine-Grained Attribute Recognition

Hao Tian, Yu Cao, P. Y. Mok

TL;DR本文提出了一种新型 DETR 方法，在 Fashionpedia 数据集上训练，通过采用多层注意力模块来聚合不同规模的特征，识别出整体服装实例的细粒度属性并实现服装的分割，超越了领域内之前最先进的模型。

Abstract

clothing segmentation and fine-grained attribute recognition are challenging tasks at the crossing of computer vision and →

clothing segmentation attribute recognition computer vision detr fashion

发现论文，激发创造

Fashionformer: 一种简单、有效和统一的基础模型，用于人类时尚分割和识别

本研究提出了一种基于 Vision Transformer 的人类时尚理解方法，通过联合分割和属性识别任务实现，使用对象和属性查询链接分割和预测结果，并使用 Multi-Layer Rendering 模块实现更细粒度的特征探索，实验证明该方法在三个人类时尚数据集上的效果较之前的方法相对提高了 10％。

Apr, 2022

通过信息增强和自适应特征融合的方式，在 DETR 中进行小物体检测

本研究针对小物体检测中 RT-DETR 模型的准确性不足提出了两个关键改进：首先，引入细粒度路径增强方法以提供更多详细信息来精确定位小物体；其次，采用自适应特征融合算法来有效整合不同尺度的特征信息，从而提高模型对不同尺度目标的检测准确率。

Jan, 2024

深度时尚图像的细粒度属性识别注释改进

该研究旨在通过选择具有足够图像数量的类别，删除非常稀少的属性以及在每个类别中合并重复属性，为细粒度属性识别任务量身定制 DeepFashion 数据集，并使用成对排名损失函数的双线性卷积神经网络进行多标签细粒度属性识别，提高了结果，并提供了每个所选类别的详细注释。

Jul, 2018

服装属性多任务课程迁移深度学习

该论文提出了一种基于多任务课程转移（MTCT）的深度学习方法用于探索来自网络零售商的大规模服装图片数据对服装特征进行细粒度分类，该方法比现有方法具有显著的优势。

Oct, 2016

DA-DETR: 带信息融合的领域自适应检测变压器

设计了 DA-DETR，一种域自适应物体检测变压器，引入信息融合以实现从一个带标记的源域到一个未标记的目标域的有效传输，并采用 CTBlender 对卷积神经网络特征和变换器特征进行聚合。在多个广泛采用的域自适应基准测试中，DA-DETR 不断实现卓越的检测性能。

Mar, 2021

细粒度时尚检索的属性引导多级注意力网络

本研究提出了一种属性引导的多层注意力网络（AG-MLAN），能够在指定属性的引导下更准确地定位属性位置和捕捉区分性特征，并通过对深度时尚、FashionAI 和 Zappos50k 数据集上的实验验证了其在细粒度时尚相似度学习和属性引导检索任务中的有效性。该模型在细粒度时尚相似度检索任务中的表现超过了现有最优方法。

Dec, 2022

DETR++：驯服您的多尺度检测 Transformer

本文介绍了作者提出的一个新的检测架构 DETR++，在目标检测方面的性能上优于现有基线，并提出了一种 BiFPN 方法，最大限度地提高了多尺度特征的准确性。

Jun, 2022

渐进式时尚属性提取

本文提出了一种渐进式训练方法，针对时装类别的多类属性识别问题，使用单个模型进行多类属性识别，从而获得对丢失和模糊标记数据鲁棒性和精细属性的提取的高准确性

Jun, 2019

显著性 DETR：用分层显著性过滤改进检测 Transformer

通过引入分层显著性筛选细化和稳定的两阶段初始化查询模块，该研究论文在 DETR 类方法中取得了显著的性能提升，克服了规模偏差和语义不匹配的问题，并在多个任务特定的检测数据集上实现了 4.0% ~ 4.4% 的平均准确率（AP）提高以及在 COCO 2017 数据集上实现了 49.2% 的 AP 提高，并且使用更少的 FLOPs 达到了更高的计算效率。

Mar, 2024

DETR 不需要多尺度或局部设计

本论文介绍了一种改进的 DETR 检测器，它采用了 “简洁” 的设计，使用单尺度特征图和全局交叉注意力计算，并没有特定的局部约束，与之前基于 DETR 的主要检测器相比，没有重新引入多尺度和局部性的架构偏好。我们展示了两种简单的技术在简洁设计中的出人意料的有效性，以弥补多尺度特征图和局部性约束缺失的问题。第一种是将盒子到像素相对位置偏差（BoxRPB）项添加到交叉注意力公式中，它很好地指导每个查询与对应的对象区域相互关注，并提供了编码灵活性。第二种是基于遮蔽图像模型（MIM）的骨干预训练，有助于学习具有细粒度定位能力的表示，并且对于补救对多尺度特征图的依赖是至关重要的。通过结合这些技术和最新的训练方法和问题形成策略，改进的 “简洁” DETR 检测器在原始 DETR 检测器的基础上取得了显著的改进。通过利用 Object365 数据集进行预训练，使用 Swin-L 骨干网络达到了 63.9 的平均精度（mAP），与依赖于多尺度特征图和基于区域的特征提取的最先进的检测器性能相媲美。代码在此 https URL 中提供。

Aug, 2023