Jan, 2024

基于实例的 SAM: 为多样化视觉任务构建开放世界模型

TL;DR引入地面 SAM,使用地面化 DINO 作为开放目标检测器并结合分段任何模型(SAM),实现基于任意文本输入的任何区域的检测和分割,并打开了连接各种视觉模型的大门。