Aug, 2024

SAM 2:在图像和视频中进行任意分割

TL;DR本研究针对图像和视频中的可提示视觉分割问题提出了Segment Anything Model 2(SAM 2),构建了一个用户交互的数据引擎,以收集迄今为止最大的video segmentation数据集。通过使用我们的模型,视频分割的准确性显著提高,且交互次数减少到以前方法的三分之一,展现出在图像分割方面比之前的模型更快和更精准的处理能力。