Sep, 2024
VMAD:视觉增强的多模态大语言模型用于零-shot异常检测
VMAD: Visual-enhanced Multimodal Large Language Model for Zero-Shot
Anomaly Detection
TL;DR本文研究了零-shot异常检测中现有方法的不足,尤其是在无法处理未见缺陷上。提出了一种新颖的框架VMAD,通过结合视觉知识和细粒度感知,显著提高了异常检测的准确性与分析能力。实验结果表明,该方法在多个基准数据集上优于现有最先进技术,具有重要的工业应用潜力。