Apr, 2023

针对 DETR 的语言感知多个数据集检测预训练

TL;DR本文提出了一种预训练 DETR 检测器的强大框架,命名为 METR,通过引入预训练语言模型将经典的目标检测器多分类转化为二分类,从而在不需要手动标注标签空间的情况下利用多个数据集联合预训练模型,并通过组合二分匹配策略实现预测。在大量实验中表明 METR 具有出色的性能表现,并可高度灵活地传递到各种 DETR-like 检测器上。