Dec, 2023
高效SAM:基于掩码图像预训练的高效物体分割
EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment
Anything
TL;DR基于大规模Transformer模型的SAM模型制约了其在广泛现实应用中的计算成本。为解决这个问题,我们提出了轻量级SAM模型EfficientSAMs,借助图像预训练方法SAMI,通过SAM图像编码器重建特征进行视觉表征学习,并在SA-1B上微调模型,实现对图像分类、对象检测、实例分割和语义对象检测等多个视觉任务的评估。结果显示,SAMI方法在面向零样本实例分割等任务上,我们的EfficientSAMs表现优于其他快速SAM模型,达到显著增益(例如,在COCO/LVIS上的AP提高了约4个点)。