Mar, 2024

T-Rex2:通过文本 - 视觉提示协同实现通用物体检测

TL;DR我们提出了 T-Rex2,这是一个高度实用的模型,用于开放集目标检测,通过对比学习,T-Rex2 结合了文本提示和视觉提示的优势,在不同场景中能够展示出卓越的零样本目标检测能力。