CVPRMar, 2023

孪生 DETR

TL;DR本文提出了一种用于 Transformer 架构中 Siamese 自监督预训练的方法,通过多视角学习框架同步进行定位和区分,设计了两种自监督的预训练任务:多视区域检测和多视语义区分。