缺陷检测的修复变压器
基于 Vision Transformer 架构和 Patch 掩蔽技术的图像异常检测方法,将输入图像分成多个分辨率的 Patch,在忽略异常信息的同时对周围数据进行重建,相较传统方法性能更好,MVTec 和 head CT 等数据集上实现了良好的结果。
Oct, 2022
本文综述了当前图像或视频修复方法,特别关注基于 Transformer 的技术,旨在突出显著改进的方法,为图像或视频修复领域的新研究者提供指南,并通过其架构配置、损伤类型和性能指标对基于 Transformer 的技术进行分类。另外,我们提出了当前挑战的整理综合,以及对图像或视频修复领域未来研究的建议。
Jun, 2024
BAT-Fill 提出了一种图像修复的新框架,使用了基于 transformers 的双向自回归模型,在考虑到上下文信息的基础上修复缺失或破损的区域,使得修缮后的图片具有更好的内容多样性和视觉效果。
Apr, 2021
本文提出使用受自我监督预训练的 MAE 方法,作为 inpainting 模型的新骨架,并加入 MAE 注意先验,以增强 inpainting 模型的长距离依赖性,验证结果显示该方法在 Places2 和 FFHQ 上都取得了较好的效果。
Aug, 2022
本研究提出一种基于无监督异常检测方法的肿瘤检测方法,通过学习健康解剖结构,提出了一种稳健的基于修复模型的健康解剖结构重建方法,并基于此提出了一个自动修复的肿瘤检测方法,经实验证明,该方法在多模态图像中与有监督检测相比效果非常接近。
May, 2023
通过引入新颖的遮罩感知像素混洗下采样模块(MPD)和在模型内进行高级推理的同时保持提取自损坏图像的可见信息的完整性的方法,以及通过空间激活通道注意力层(SCAL)提供的有效自注意力机制在多个尺度上对损坏图像建模,我们提出了一种端到端的高质量修复变换器 (HINT),该方法在 CelebA、CelebA-HQ、Places2 和敦煌等四个数据集上展示了超越当代最先进模型的卓越性能。
Feb, 2024
该论文介绍了一种用于图像修复的新型深度神经网络,该网络包含了一个修复分支和两个辅助分支,能够有效地利用多模式定位和语义信息,实现对各种正 / 不规则图像遮挡的修复,达到了最好的效果。
Aug, 2022
本文提出了一种基于 transformer 的大孔修复模型,它结合了大尺寸的图像处理和 transformer 的优势,通过在注意力模块中定制面向修复的 transformer 块并使用动态掩码来聚合非局部信息,得到了在多个基准数据集上最先进的效果。
Mar, 2022
设计了一种具有优秀鲁棒性和泛化能力的受信任的视频修复定位网络(TruVIL),通过深度关注噪声学习多个阶段以捕捉修复痕迹,通过交叉模态关注融合模块探索两种互补模态之间的相关性,通过关注噪声解码模块选择性增强空间细节,实验证明了 TruVIL 相对于现有技术的卓越性能。
Jun, 2024
表面检查中的异常检测是制造业中一项重要且具有挑战性的任务,我们提出了一种名为 Excision and Recovery(EAR)的新型重建方法,通过单一确定性掩模来屏蔽潜在的疑似缺陷区域,用于异常检测。通过实验证明,EAR 模型在异常检测性能和吞吐量方面均优于现有方法。
Oct, 2023