Apr, 2021

通过视觉和语言知识蒸馏进行开放式目标检测

TL;DR本文提出了一种通过视觉和语言知识蒸馏的训练方法ViLD,使得我们可以使用预先训练的图像分类模型直接检测和分类未知类别的物体,其在LVIS和其他数据集上的表现超过了现有的最先进水平。