一种视频修复的内部学习方法
通过深度学习,对于图像和视频修复的基于深度学习的方法进行综合评述,并从高水平的修复流程、深度学习架构、模块设计等多个角度进行分类总结。同时,讨论了训练目标、常见基准数据集、评估指标以及各修复方法的优势、局限性及实际应用,并探讨了公开挑战和未来可能的研究方向。
Jan, 2024
本文提出了一种新颖的视频修复方法,使用 Deep Flow Completion 网络综合光流场来引导像素填充,从而保证了视频内容的时空连贯性,并在 DAVIS 和 YouTube-VOS 数据集上取得了最优的修复质量和速度。
May, 2019
本文提出了一种基于深度学习的快速视频修复网络,结合图像编解码模型,利用邻帧信息综合填充未知视频区域,并运用循环反馈和时间存储模块确保输出的时空连续性,与之前的视频修复方法相比,其结果更为语义正确和时空平滑,且可用于视频重定向任务并生成优质视觉效果。
May, 2019
通过将视频修复问题作为条件生成建模问题加以解决的框架,以及利用生成方法的优势,本文展示了能够生成多样化且高质量修复效果的方法,并能够在时间、空间和语义上与给定的上下文相协调地合成新内容。
Apr, 2024
利用深度学习构建了 Copy-and-Paste Networks 模型,以实现视频修复和增强,能够从与目标帧对应的参考帧中复制相关内容并粘贴填充,从而提高视频修复效果和车道检测精度。
Aug, 2019
通过提出的两个新损失函数:音频 - 视觉关注损失和音频 - 视觉伪类一致性损失,我们向视频修复网络传递音频 - 视觉对应关系的先验知识,进而提高视频修复的性能。实验证明,我们的方法可以更好地恢复更广泛的视频场景,并且在场景中的声音对象局部遮挡时特别有效。
Oct, 2023
这篇论文提出了一种基于全局、基于补丁的功能的自动视频修复算法,可以处理动态纹理、多个移动对象和移动背景等挑战情况,并在执行时间方面比现有技术快一个数量级。最终的算法不需要分割或手动输入,只需要定义修复遮罩即可,并且能够处理比以前的工作更广泛的情况。
Mar, 2015
基于对比学习的 Video Inpainting LOcalization (ViLocal) 方案使用 3D Uniformer 编码器学习了有效的时空取证特征,通过吸引 / 排斥正 / 负原始和伪造像素对捕捉到了图像修复不一致,然后通过专门的两阶段训练策略利用轻量级卷积解码器生成了一个像素级修复定位地图,实验证明 ViLocal 优于现有技术。
Jun, 2024
该研究提出一种基于渐进式时间特征对齐网络的视觉修复方法,通过充分利用光流信号从相邻的视频帧中提取特征来消除时空对齐中的问题,实现了对视频内容的自然修复和优化,进而在多个数据集上获得了目前的最佳表现。
Apr, 2021