Aug, 2023
AnomalyGPT:利用大型视觉-语言模型检测工业异常
AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language
Models
TL;DR利用大型视觉语言模型(LVLMs)解决工业异常检测(IAD)问题的关键在于提出了一种基于LVLM的新型IAD方法AnomalyGPT,通过模拟异常图像以及为每个图像生成对应的文本描述来生成训练数据,并利用图像解码器提供细粒度语义和设计,通过启示式嵌入fine-tune LVLM,消除了手动阈值调整的需求,直接评估异常的存在和位置,在MVTec-AD数据集上实现了86.1%的准确率,94.1%的图像级AUC和95.3%的像素级AUC。