Feb, 2024

LLMs遇见VLMs:用细粒度描述符提升开放词汇物体检测

TL;DRDVDet是一个描述符增强的开放词汇检测器,引入条件上下文提示和分层文本描述符,实现了精确的区域-文本对齐以及一般的开放词汇检测训练。