Nov, 2023

基于大型模型的指代伪装物体检测

TL;DR提出一种基于大型模型的多层次知识引导的多模态方法,用于参考化伪装目标检测(Ref-COD),实现语义智能和内在知识的全面利用,达到了与参考相对应的伪装目标和伪装场景的渐进感知,并深度对齐文本参考与伪装照片。