ICCVSep, 2023

CoTDet:专注于任务驱动的物体检测的能力知识引导

TL;DR本文提出了基于任务驱动的物体检测方法,通过探索基本意义而非物体类别来提取关键属性,并使用多级思维链激励法从大规模语言模型中提取与任务、物体示例和关键视觉属性相关的知识。进一步,我们提出了一种知识条件检测框架 CoTDet,有效利用知识来增强物体识别和定位,并得到支持物体检测的合理解释。实验证明,我们的 CoTDet 方法在性能上显著优于当前最先进的方法(提升 15.6 个方框 AP 值和 14.8 个掩膜 AP 值)。