Dec, 2023

分割和标注任何东西

TL;DR提出了一种方法,能够高效地为 Segment Anything Model (SAM) 添加生成区域描述的功能,并且通过引入轻量级的基于查询的特征混合器使区域特征与语言模型的嵌入空间对齐,以便进行后续的描述生成。该方法具有小的可训练参数数量,计算量少、内存使用少和通信带宽少的特点,因此训练速度快且可扩展。通过先在目标检测和分割任务上进行弱监督预训练以解决区域描述数据稀缺问题。该方法的优越性得到了广泛的实验证明,并对每个设计选择进行了验证。本研究在扩展区域描述数据和探索为 SAM 增加区域语义方面具有重要意义。