CLIP3D-AD:使用多视角图像生成扩展 CLIP 进行 3D 小样本异常检测
本文介绍了一种利用大型视觉语言模型 CLIP 的零样本异常检测方法 CLIP-AD,采用语言引导策略,通过引入 Staged Dual-Path 模型来解决相似度计算、关键特征、文本与图像特征等问题,进一步引入线性层进行 fine-tuning 来增强性能。实验证明,该方法在分类 / 分割 F1 分数上优于现有方法 1.0/1.2,并且经过扩展的模型 SDP + 可以获得进一步的改进,提高了分类 / 分割 F1 分数 1.9/11.7。
Nov, 2023
在医学决策领域,精确的医学成像异常检测在帮助临床医生方面起着关键作用。本文首先侧重于医学图像异常检测在少样本情景下的任务,这对于数据采集和注释都非常昂贵的医学领域至关重要。我们提出了一种创新的方法,MediCLIP,通过自监督微调,将 CLIP 模型适应于少样本医学图像异常检测。当仅提供少量正常医学图像时,MediCLIP 相比其他方法在异常检测和定位方面实现了最先进的性能。三个不同的医学异常检测任务上的大量实验证明了我们方法的优越性。
May, 2024
我们提出了一个统一的框架 CLIP-ADA 用于通过适应预训练 CLIP 模型进行异常检测,在这个框架中,我们通过引入可学习的提示,并通过自监督学习将其与异常模式关联起来,从而获得多类别工业图像上的统一异常检测,并且通过引入异常区域细化策略来充分利用 CLIP 的表示能力来提高定位质量,我们的框架在 MVTec-AD 和 VisA 上取得了 97.5/55.6 和 89.3/33.1 的最新成果,以及在极小的训练数据下取得了令人鼓舞的性能,这更具挑战性。
Mar, 2024
通过直接利用对比式语言 - 图像预训练模型 (CLIP) 在视频领域的强大表示能力和设计鲁棒的视频异常检测器,本文提出了 VadCLIP,一种弱监督视频异常检测范例,无需预训练和微调过程,通过双分支实现粗粒度和细粒度的视频异常检测,实验结果在两个常用基准上表现出色,超越了目前其他方法一大截。
Aug, 2023
本文基于 Contrastive Vision-Language Pre-training (CLIP) 提出了一种对应 PointCloud 数据和 3D 文本分类的零样本和小样本学习模型 PointCLIP,并通过在 ModelNet10、ModelNet40 和 ScanObjectNN 数据集上的实验证明其有效性。
Dec, 2021
AnomalyCLIP 通过学习无关物体的文本提示来捕捉图像中的通常和异常,从而实现了对高度多样的物体数据集进行广义正常性和异常性识别的零样本卓越性能。
Oct, 2023
本文介绍了一种用于医学异常检测的轻量级多层次自适应对比框架,通过将多个残差适配器整合到预训练的视觉编码器中,通过多级像素级视觉 - 语言特征对齐损失函数引导多级适应,使其适用于医学图像。实验结果表明,我们的方法在医学异常检测基准上显著超越了当前最先进的模型,在零样本和少样本情况下分别实现了 6.24% 和 7.33% 的平均 AUC 提升用于异常分类,以及 2.03% 和 2.37% 的平均 AUC 提升用于异常分割。
Mar, 2024
通过引入双图增强 CLIP 方法,结合视觉 - 语言评分系统,对图像异常检测进行了增强,包括利用图像进行相互参考以增强推理过程的视觉环境,以及在测试时引入合成异常来提高定位能力。该方法充分利用了视觉 - 语言联合异常检测的潜力,并在各种数据集上展现了与当前最先进方法相媲美的性能。
May, 2024
本文介绍了用于工业视觉检测的一个方案,该方案使用 CLIP 模型和多个存储器来实现无标准参考图像的零射和少射跟踪,从而实现对大量产品类型的快速自适应,并在 VAND 2023 挑战赛中获得了一等奖。
May, 2023
本文提出一种少样本异常检测方法,通过注册任务作为代理任务,训练一个通用的无类别模型来检测输入图像是否为异常,并在大型基准测试中实现了优于现有方法 3%-8%的表现。
Jul, 2022