May, 2023

跨模态掩码自蒸馏用于指代图像分割的 CM-MaskSD

TL;DR本文提出了一种名为 CM-MaskSD 的跨模态掩膜自学习框架,利用被称为 CLIP 模型的知识实现了精细的图像 - 文本对齐,并引入少量参数协调多模态特征,使其在三个基准数据集上优于现有方法,实现了对指定图像中物体的分割。