基于 Transformer 的自监督预训练技术用于人员重新识别

Nov, 2021

基于 Transformer 的自监督预训练技术用于人员重新识别

Self-Supervised Pre-Training for Transformer-Based Person Re-Identification

Hao Luo, Pichao Wang, Yi Xu, Feng Ding, Yanxin Zhou...

TL;DR本篇研究旨在探讨利用数据和模型结构两个角度缩小 Transformer 预训练在 Person Re-Identification 任务中的领域差距。首先利用无标签人员图像预训练 Vision Transformer 来代替通常需要更大规模预训练数据集如 ImageNet-21K 的方法，并用 Catastrophic Forgetting Score 和 ReID-specific module 对领域差距进行缩小。最终成果是在 Market-1501 和 MSMT17 上获得了最先进的性能表现。

Abstract

Transformer-based supervised pre-training achieves great performance in person re-identification (ReID). However, due to the domain gap between ImageNet and ReID datasets, it usually needs a larger pre-training dataset (e.g. ImageNet-21K) to boost the performance because of the strong

person re-identification transformer-based pre-training self-supervised learning catastrophic forgetting score ibn-based convolution stem

发现论文，激发创造

无监督预训练用于个体再识别

本文介绍了一个名为 LUPerson 的大规模未标记人物重识别数据集，并尝试进行无监督预训练来提高学习到的人物 Re-ID 特征表示的泛化能力，探究了数据增强和对比损失等方面对学习 Re-ID 特征的关键因素，其使用预训练模型可以获得在现有数据集上的最先进结果。

Dec, 2020

通过人内标识规范化释放无监督预训练的潜力，用于个体重新识别

本文设计了一个基于对比学习管道的无监督预训练框架 UP-ReID，旨在解决细粒度 ReID 特征学习中的两个关键问题，并介绍了全局一致性和局部补丁之间的内在对比约束，在多个流行的 Re-ID 数据集上进行了广泛的实验，结果表明，我们的 UP-ReID 预训练模型可以显著改进下游 ReID 微调，并实现了最先进的性能。

Dec, 2021

PASS: 面向人员再识别的部位感知自监督预训练

本文提出了一种面向个人再识别的预训练方法 PASS（Part-Aware Self-Supervised Pre-Training），可生成部分级特征提供细粒度信息，并在 Market1501 和 MSMT17 等任务上取得了最新的最优性能表现。

Mar, 2022

领域内自监督学习可提高遥感图像分类

本文研究了自监督学习在遥感图像分类中的应用，使用 ViT 模型和 iBOT 框架进行预训练可以提高模型预测性能。

Jul, 2023

自我训练与渐进增强用于跨领域无监督人员再识别

该研究提出了一种自训练的方法，使用渐进式增强框架 (PAST) 来不断提高模型在目标数据集上的表现，并在保守阶段和促进阶段之间交替进行三元组的损失优化，最终在无监督交叉领域设置下达到了最先进的人员重新识别绩效

Jul, 2019

使用扩散模型合成高效的数据进行个体重新识别预训练

提出了一种新的 Diffusion-ReID 范例，通过生成和过滤阶段来有效增强和生成不同的图像，首先创造了一个新的大规模人员重识别数据集 Diff-Person，接着构建了一个基于 Diff-Person 预训练的更强大的人员重识别模型，与其他预训练和自监督竞争者相比，展现了显著的优势。

Jun, 2024

考虑部分信息的可推广人员再识别变压器

我们提出了一种适用于域泛化人物重识别任务的纯 Transformer 模型，通过设计了一个名为 Cross-ID Similarity Learning (CSL) 的代理任务来挖掘不同 ID 之间共享的局部视觉信息，从而缓解领域特定偏差的副作用，并在此基础上提出了 Part-guided Self-Distillation (PSD) 来进一步提高全局特征的泛化性能。在大多数域泛化人物重识别设置下，我们的方法实现了当前最先进的性能，在 Market$ o$Duke 设置下，我们的方法在 Rank1 和 mAP 上超过了当前最先进的性能，分别提升了 10.9% 和 12.8%。

Aug, 2023

基于伪造文本的统一预训练技术用于文本 - 图像人物重识别

该论文介绍了一种面向文本到图像人物重识别任务的统一预训练方法 (UniPT)，通过构建大规模的文本标注人物数据集、使用视觉 - 语言预训练框架来对齐图像和文本模态的特征空间，解决了数据不一致性和训练不一致性的问题。UniPT 在多个数据集上取得了有竞争力的准确率。

Sep, 2023

SiT：自监督视觉 Transformer

本文提出了一种名为 Self-supervised vIsion Transformers (SiT) 的模型，使用多种自监督训练机制进行预训练，通过线性分类器对其学习特征进行评估，并在小规模数据集上进行下游分类任务，结果表明这种模型在自我监督学习上有很好的效果。

Apr, 2021

大规模预训练用于带噪标签的人物再识别

本文提出了一个大规模预训练框架，采用在线多目标跟踪系统对现有未标记的 Re-ID 数据集 “LUPerson” 中的原始视频进行预处理，并通过三个学习模块联合学习，以簇类相似的样例到一个原型上并根据原型分配校正噪声标签，实现从头开始学习 SOTA Re-ID 表征，显著提高了性能。

Mar, 2022