Nov, 2021

基于 Transformer 的自监督预训练技术用于人员重新识别

TL;DR本篇研究旨在探讨利用数据和模型结构两个角度缩小 Transformer 预训练在 Person Re-Identification 任务中的领域差距。首先利用无标签人员图像预训练 Vision Transformer 来代替通常需要更大规模预训练数据集如 ImageNet-21K 的方法,并用 Catastrophic Forgetting Score 和 ReID-specific module 对领域差距进行缩小。最终成果是在 Market-1501 和 MSMT17 上获得了最先进的性能表现。