Aug, 2023

使用 CLIP 的随机词数据增强技术进行零样本异常检测

TL;DR提出了一种利用视觉 - 语言模型 CLIP 作为零样本异常检测的数据源的新方法,通过在滑动窗口方式下对图像的每个部分应用提示引导分类,通过生成文本嵌入来训练前馈神经网络,从 CLIP 的嵌入中提取正常和异常特征,实现了无需训练图像的无类别异类检测,取得了零样本设置下的最新性能。