Sep, 2024

VMAD:视觉增强的多模态大语言模型用于零-shot异常检测

TL;DR本文研究了零-shot异常检测中现有方法的不足,尤其是在无法处理未见缺陷上。提出了一种新颖的框架VMAD,通过结合视觉知识和细粒度感知,显著提高了异常检测的准确性与分析能力。实验结果表明,该方法在多个基准数据集上优于现有最先进技术,具有重要的工业应用潜力。