Nov, 2023

CLIP-AD:语言导向的分层双路径零样本异常检测模型

TL;DR本文介绍了一种利用大型视觉语言模型 CLIP 的零样本异常检测方法 CLIP-AD,采用语言引导策略,通过引入 Staged Dual-Path 模型来解决相似度计算、关键特征、文本与图像特征等问题,进一步引入线性层进行 fine-tuning 来增强性能。实验证明,该方法在分类 / 分割 F1 分数上优于现有方法 1.0/1.2,并且经过扩展的模型 SDP + 可以获得进一步的改进,提高了分类 / 分割 F1 分数 1.9/11.7。