对比学习下的视频修复定位

Jun, 2024

Video Inpainting Localization with Contrastive Learning

Zijie Lou, Gang Cao, Man Lin

TL;DR基于对比学习的 Video Inpainting LOcalization (ViLocal) 方案使用 3D Uniformer 编码器学习了有效的时空取证特征，通过吸引 / 排斥正 / 负原始和伪造像素对捕捉到了图像修复不一致，然后通过专门的两阶段训练策略利用轻量级卷积解码器生成了一个像素级修复定位地图，实验证明 ViLocal 优于现有技术。

Abstract

deep video inpainting is typically used as malicious manipulation to remove important objects for creating fake videos. It is significant to identify the inpainted regions blindly. This letter proposes a simple yet effective forensic scheme for Video Inpainting LOcalization with ContrA

deep video inpainting forensic scheme vilocal spatiotemporal forensic features pixel-wise inpainting localization

发现论文，激发创造

基于深度注意力噪声学习的可信视频修复定位

设计了一种具有优秀鲁棒性和泛化能力的受信任的视频修复定位网络（TruVIL），通过深度关注噪声学习多个阶段以捕捉修复痕迹，通过交叉模态关注融合模块探索两种互补模态之间的相关性，通过关注噪声解码模块选择性增强空间细节，实验证明了 TruVIL 相对于现有技术的卓越性能。

Jun, 2024

基于深度学习的图像和视频修复研究综述

通过深度学习，对于图像和视频修复的基于深度学习的方法进行综合评述，并从高水平的修复流程、深度学习架构、模块设计等多个角度进行分类总结。同时，讨论了训练目标、常见基准数据集、评估指标以及各修复方法的优势、局限性及实际应用，并探讨了公开挑战和未来可能的研究方向。

Jan, 2024

深度视频修复检测

该研究探讨了视频修补检测技术，提出了一种双流编码器解码器体系结构和注意力模块的 VIDNet 方法，该模型采用误差级别分析数据增强处理 RGB 帧，进一步利用卷积 LSTM 模型对编码得到的多模态特征进行空间和时间关系的探索，并使用四个方向的局部注意力模块来检测像素是否被修补，实验结果表明 VIDNet 方法能够在各方面超越其他同类方法并且具有很好的泛化能力。

Jan, 2021

一种视频修复的内部学习方法

提出了一种新颖的视频修复算法，通过 Deep Image Prior（DIP）推出的卷积网络，同时生成缺失的外观和光流信息，并采用一种无需先验训练的生成式方法进行修复。该方法具有良好的视觉效果和长期一致性。

Sep, 2019

深度视频修复

本文提出了一种基于深度学习的快速视频修复网络，结合图像编解码模型，利用邻帧信息综合填充未知视频区域，并运用循环反馈和时间存储模块确保输出的时空连续性，与之前的视频修复方法相比，其结果更为语义正确和时空平滑，且可用于视频重定向任务并生成优质视觉效果。

May, 2019

音视频自监督引导的深度视频修复

通过提出的两个新损失函数：音频 - 视觉关注损失和音频 - 视觉伪类一致性损失，我们向视频修复网络传递音频 - 视觉对应关系的先验知识，进而提高视频修复的性能。实验证明，我们的方法可以更好地恢复更广泛的视频场景，并且在场景中的声音对象局部遮挡时特别有效。

Oct, 2023

复杂场景视频修复

这篇论文提出了一种基于全局、基于补丁的功能的自动视频修复算法，可以处理动态纹理、多个移动对象和移动背景等挑战情况，并在执行时间方面比现有技术快一个数量级。最终的算法不需要分割或手动输入，只需要定义修复遮罩即可，并且能够处理比以前的工作更广泛的情况。

Mar, 2015

基于上下文的图像修复：推断、匹配和翻译

本文提出了一种基于深度神经网络和纹理传播的学习方法来完成图像修复，通过分离任务为推理和翻译两个步骤并用简单的启发式算法指导局部纹理从边界到空洞的传播，我们证明了我们的方法在几个公共数据集上能够产生比以前的最先进方法更高质量的视觉结果。

Nov, 2017

通过联合学习时空结构和空间细节进行视频修复

本文提出了一种新的基于数据驱动的视频修复方法，采用了深度学习的网络结构，包含了两个子网络，一个是基于 3D 完全卷积的时间结构推断网络，另一个是二维全卷积网络的空间细节修复网络，该方法能够更好的恢复缺失的区域，并且其效果优于以往的视频修复方法。

Jun, 2018

重新构想现实：视频修复技术的综合调研

这篇论文通过分析视频修复技术的最新进展，探讨了计算机视觉和人工智能中的一个关键领域。论文通过人工评估和计算资源比较综合考虑视觉质量和计算效率之间的平衡，并为未来探索这个充满活力和不断发展的领域提供了指导。

Jan, 2024