Nov, 2023

T-Rex:通过视觉提示进行计数

TL;DRT-Rex 是一个交互式的物体计数模型,通过视觉提示将物体计数形式化为开放集物体检测任务,可通过标记参考图像上的点或框来指定感兴趣的物体,然后检测具有相似模式的所有物体,并通过 T-Rex 的视觉反馈进行交互式地修正计数结果。该模型在全面的场景和挑战下展现出优异的零样例物体计数能力,且在视觉提示领域具有潜在的实际应用场景。