CVPRMay, 2022

超越边界框:目标检测的多模态知识学习

TL;DR该论文介绍了一种利用语言提示来增强物体检测的方法,用 bounding box annotations 填充语言提示中,利用跨模态信息将语言知识注入到检测模型中,同时,该方法还生成了 hard negatives 进一步提升检测性能。该方法在 MS-COCO 和 OpenImages 数据集上实现了最新的领先水平。