具视觉注意力的拼接定位网络：多领域特征提取器和多感受野上采样器

Jan, 2024

具视觉注意力的拼接定位网络：多领域特征提取器和多感受野上采样器

A Visually Attentive Splice Localization Network with Multi-Domain Feature Extractor and Multi-Receptive Field Upsampler

PDF

Ankit Yadav, Dinesh Kumar Vishwakarma

TL;DR本研究提出了一种名为 “具有视觉关注的多领域特征提取器和多接受域上采样器的图像拼接定位网络” 的新颖方法，它包含了一种独特的 “具有视觉关注的多领域特征提取器”（VA-MDFE），用于从 RGB、边缘和深度领域提取注意力特征。接下来，负责融合和下采样多领域特征的是 “具有视觉关注的下采样器”（VA-DS）。最后，一种新颖的 “具有视觉关注的多接受域上采样器”（VA-MRFU）模块通过专注于不同的信息尺度，使用基于接受域的多个卷积方法来上采样注意力特征。实验结果在公共基准数据集 CASIA v2.0 上证明了该模型的有效性。相较于现有的最先进方法，它在 IoU 得分达到 0.851，像素 F1 得分达到 0.9195，像素 AUC 得分达到 0.8989，表现优越。

Abstract

image splice manipulation presents a severe challenge in today's society. With easy access to image manipulation tools, it is easier than ever to modify images that can mislead individuals, organizations or society. In this work, a novel, "→

image splice manipulation visually attentive splice localization network multi-domain feature extractor multireceptive field upsampler casia v2.0

发现论文，激发创造

MDFL：多域扩散驱动特征学习

多域扩散驱动特征学习网络对高维图像进行特征提取，显著改进了性能并揭示了其内在模式和结构。

Nov, 2023

医学图像分割的空间频率双重逐步注意力网络

我们提出了 SF-UNet，这是一个具有空间频率双域注意力网络的模型，用于准确的医学图像分割，并在三个公共数据集上证明其有效性。

Jun, 2024

一种用于零样本增量学习的新型空间频域网络

本文提出了一种新颖的基于空间频率领域网络（SFDNet）的零样本增量学习方法，其中包含了空间频率特征提取模块（SFFE）和注意力特征对齐模块（AFA），通过从样本图像领域捕捉重要信息，提高零样本转换分类增量算法的性能。该网络能够有效地提取图像的空间频率特征表示，提高图像分类的准确性，并从根本上缓解了灾难性遗忘。针对 CUB 200-2011 和 CIFAR100 数据集的广泛实验表明，我们提出的算法胜过了最先进的增量学习算法。

Feb, 2024

准确且轻量级的去雾方法：多接受野非局部网络和新型对比正则化

提出了一种基于多接收域非局部网络（MRFNLN）的图像去雾方法，该方法利用深度学习方法提取有用特征，并通过多流特征注意力块（MSFAB）和交叉非局部块（CNLB）实现对图像去雾的优化，同时引入了新颖的细节聚焦对比正则化（DFCR）以提高模型性能。

Sep, 2023

视频拼接定位的时空共注意融合网络

提出了一种用于视频拼接定位的时空注意力融合网络（SCFNet），通过多帧捕捉操纵痕迹、并行和交叉注意力融合模块实现时空法证特征的深度交互和融合，通过轻量级多层感知机（MLP）解码器产生像素级篡改定位图，在基准数据集上的广泛测试表明，SCFNet 的定位和泛化性能优于现有技术。

Sep, 2023

使用特征融合的双注意力 U-Net：拓展多类缺陷分割的边界

提出的架构 Dual Attentive U-Net with Feature Infusion (DAU-FI Net) 在语义分割方面解决了多类别不平衡数据集和有限样本的挑战，通过集成多尺度空间 - 通道注意力机制和特征注入来增强目标定位精度。该架构通过使用 Gabor 滤波器进行纹理分析、Sobel 和 Canny 滤波器进行边缘检测的方式来扩展特征空间，提供了语义分割的鲁棒解决方案，对于有限的训练数据的多类问题具有推进意义。

Dec, 2023

利用多域视觉信息进行虚假新闻检测

本文提出了一种名为 Multi-domain Visual Neural Network (MVNN) 的框架，该框架将频率和像素域的视觉信息融合起来用于检测假新闻图像。在真实数据集上的实验表明，MVNN 比现有方法至少提高了 9.2% 的准确度，并可帮助提高超过 5.2% 的多模态假新闻检测性能。

Aug, 2019

基于全新高效计算框架和新图像拼接数据集的有效图像取证

提出了一种新颖的拼接检测数据集和轻量级的时域压缩拼接检测框架，该框架在拼接检测方面具有较高的准确性和较低的计算成本，并在提出的数据集和 CASIA v2.0 数据集上取得了优于现有方法的最佳模型准确率为 0.9382。

Jan, 2024

一种用于图像拼接定位的多流融合网络

本文提出了一种多流网络架构，该架构使用编码器 - 解码器架构，由多个编码器流组成，分别处理篡改图像或手工制作的信号，从而独立地捕获每个信号的相关信息，并在架构的瓶颈处融合多个流的特征，并传播到生成输出定位图的解码器网络，以解决图像拼接定位问题，并在公共取证数据集上取得了具有竞争性的性能和最先进的结果。

Dec, 2022

基于空间频率融合的双域多曝光图像融合网络

通过空频积分框架 (Spatial-Frequency Integration Framework) 提出了一种新颖的多曝光图像融合方法 (MEF-SFI)，通过有效利用频率域的整体光照建模能力，结合空间和频率路径的深度傅里叶变换方法，以及双域损失函数的综合作用，实现了对输入图像的融合，取得了与最先进的多曝光图像融合方法相媲美的视觉效果。

Dec, 2023