多图像视觉问答用于无监督异常检测

Apr, 2024

多图像视觉问答用于无监督异常检测

Multi-Image Visual Question Answering for Unsupervised Anomaly Detection

Jun Li, Cosmin I. Bercea, Philip Müller, Lina Felsner, Suhwan Kim...

TL;DR通过使用语言模型以增强未监督异常检测的解释性，我们能够构建一个包含问题和答案的数据集，并提出一种新的多图像视觉问答框架来应对异常检测，其中融合了多样的特征融合策略以增强视觉知识提取。

Abstract

unsupervised anomaly detection enables the identification of potential pathological areas by juxtaposing original images with their pseudo-healthy reconstructions generated by models trained exclusively on normal images. However, the →

unsupervised anomaly detection language models anomaly maps clinical interpretation multi-image visual question answering

发现论文，激发创造

多模态异常检测与推理的自定义视觉语言基础模型

本研究旨在开发一种适用于多个场景的通用异常检测模型，通过将视觉 - 语言基础模型定制为异常检测器和推理器，并引入多模态提示策略，将领域专家的知识作为条件来指导模型，在多模态输入表示中实现多模态异常检测和推理，从而提高异常检测性能。结果表明，该定制模型能够在不同的数据模态（如图像和点云）中检测异常，尤其适用于多物体场景和时间数据。

Mar, 2024

图像合成作为无监督组织病理学诊断的前置任务

本文提出了使用无监督生成式模型来进行异常检测的方法，并在数字病理学领域展示了其优势，实验证明这种方法比有监督模型更优秀。

Apr, 2021

医学图像视觉问答的问题中心模型

本论文提出一种基于视觉问答的方法来查询深度学习模型的行为，通过在多个医学和自然图像数据集上进行实验，证明该方法较目前方法具有相同或更高的准确度，有效地解决了深度学习方法缺乏透明性的问题。

Mar, 2020

朝着节约的无监督医学图像微细异常检测

医学成像中的异常检测是一项具有挑战性的任务，可以通过无监督异常检测方法解决，该方法通过识别与正常基准模型不匹配的特征。该论文探讨了使用混合概率分布作为替代方法，以在准确性与计算需求之间取得最优化平衡，并且介绍了一个在线方法来解决大数据量下的内存使用问题，并以帕金森病患者脑部扫描的异常检测为例进行了验证。

Sep, 2023

通过建立感知特征模型进行异常检测定位

本文提出了一种基于 Feature-Augmented VAE 的复杂异常模型的新 VAE 模型，该模型不仅在像素空间中重构输入图像，而且还在多个不同的特征空间中进行重构，通过对先前训练的卷积神经网络进行计算，对 MVTec 异常检测和定位数据集的表现明显优于现有最先进的方法。

Aug, 2020

使用图像转换技术在组织病理图像中无监督检测癌变区域

本文介绍一种基于图像转换的框架，在医学影像的癌变区域检测领域中取得了比现有的无监督方法更好的性能，并且接近于有监督方法的性能。

Apr, 2021

使用生成对抗网络进行无监督异常检测以引导标志物发现

运用无监督学习的方法，基于深度卷积生成对抗网络提出一种新的异常检测方案 AnoGAN，在视网膜光学相干断层成像（OCT）中成功地识别出包括视网膜液体或增强反射点在内的异常图像。

Mar, 2017

可解释的视觉异常检测

本文介绍了针对图像和视频的异常检测方法的可解释性研究，包括基本背景、当前可解释方法、综合文献细节及未来方向。

Feb, 2023

无监督异常定位在工业图像中的应用：一个调研

本文对深度学习下工业图像无监督异常定位的近期研究成果进行了综述与分析，包括各种概念、挑战、分类、基准数据集及量化性能比较，并提供了未来研究方向的预测和分析。

Jul, 2022

使用变分自动编码器进行无监督异常定位

提出了一种基于深度学习和变分自动编码器的医学图像寻找异常度量的解决方案，其中尤其强调了基于 Kullback-Leibler (KL) 分歧的异常定位算法，实验证明它具有比现有方法更好的性能。

Jul, 2019