Oct, 2023

CoDet:开放词汇目标检测的共现导向区域-词对齐

TL;DR利用共现对象发现的方法,CoDet克服了对预对齐视觉-语言空间依赖的限制,通过图像标题中提及共享概念的图像分组,发现并与共享概念对齐共现对象,从而实现了对象级别的视觉-语言表示,具有卓越的性能和可扩展性。