Apr, 2023

使用自监督 Transformer 进行多目标定位的目标发现

TL;DR本文提出了使用自监督学习训练的 Transformer 网络定位多个物体的方法 MOST,并通过分形分析检测出前景补丁上的代币,将代币聚类生成边界框,最终在 PASCAL-VOC 07、12 和 COCO20k 数据集上表现优于其他方法,同时表明 MOST 可以用于目标检测的自监督预训练,并在全、半监督目标检测和非监督区域提议生成方面获得一致的改进。