Jul, 2024

VCP-CLIP:零样本异常分割的视觉上下文提示模型

TL;DR基于CLIP,我们提出了一个用于零样本异常分割任务的视觉上下文提示模型(VCP-CLIP),通过先将全局视觉信息嵌入文本提示,消除了特定产品提示的必要性,然后利用图像的细粒度特征调整文本嵌入,从而激活CLIP的异常语义感知能力,在10个真实工业异常分割数据集上取得了最先进的性能。