多图像视觉问答用于无监督异常检测
本研究旨在开发一种适用于多个场景的通用异常检测模型,通过将视觉 - 语言基础模型定制为异常检测器和推理器,并引入多模态提示策略,将领域专家的知识作为条件来指导模型,在多模态输入表示中实现多模态异常检测和推理,从而提高异常检测性能。结果表明,该定制模型能够在不同的数据模态(如图像和点云)中检测异常,尤其适用于多物体场景和时间数据。
Mar, 2024
本论文提出一种基于视觉问答的方法来查询深度学习模型的行为,通过在多个医学和自然图像数据集上进行实验,证明该方法较目前方法具有相同或更高的准确度,有效地解决了深度学习方法缺乏透明性的问题。
Mar, 2020
医学成像中的异常检测是一项具有挑战性的任务,可以通过无监督异常检测方法解决,该方法通过识别与正常基准模型不匹配的特征。该论文探讨了使用混合概率分布作为替代方法,以在准确性与计算需求之间取得最优化平衡,并且介绍了一个在线方法来解决大数据量下的内存使用问题,并以帕金森病患者脑部扫描的异常检测为例进行了验证。
Sep, 2023
本文提出了一种基于 Feature-Augmented VAE 的复杂异常模型的新 VAE 模型,该模型不仅在像素空间中重构输入图像,而且还在多个不同的特征空间中进行重构,通过对先前训练的卷积神经网络进行计算,对 MVTec 异常检测和定位数据集的表现明显优于现有最先进的方法。
Aug, 2020
运用无监督学习的方法,基于深度卷积生成对抗网络提出一种新的异常检测方案 AnoGAN,在视网膜光学相干断层成像(OCT)中成功地识别出包括视网膜液体或增强反射点在内的异常图像。
Mar, 2017
本文对深度学习下工业图像无监督异常定位的近期研究成果进行了综述与分析,包括各种概念、挑战、分类、基准数据集及量化性能比较,并提供了未来研究方向的预测和分析。
Jul, 2022
提出了一种基于深度学习和变分自动编码器的医学图像寻找异常度量的解决方案,其中尤其强调了基于 Kullback-Leibler (KL) 分歧的异常定位算法,实验证明它具有比现有方法更好的性能。
Jul, 2019