深度视频修复检测
本文提出了一种基于深度学习的快速视频修复网络,结合图像编解码模型,利用邻帧信息综合填充未知视频区域,并运用循环反馈和时间存储模块确保输出的时空连续性,与之前的视频修复方法相比,其结果更为语义正确和时空平滑,且可用于视频重定向任务并生成优质视觉效果。
May, 2019
本文提出了一种新的基于数据驱动的视频修复方法,采用了深度学习的网络结构,包含了两个子网络,一个是基于 3D 完全卷积的时间结构推断网络,另一个是二维全卷积网络的空间细节修复网络,该方法能够更好的恢复缺失的区域,并且其效果优于以往的视频修复方法。
Jun, 2018
本文介绍了一种名为 MumPy 的新型多边时空视图金字塔变换器,提出了一种利用新设计的多边时空视图编码器和可变形窗口时空视图交互模块的方法来灵活地合作处理空间 - 时间线索,以及开发了一个多金字塔解码器来聚合各种特征并生成检测图,通过调整空间和时间线索的贡献强度,我们的方法能够有效地识别修复区域。我们在现有数据集上验证了我们的方法,并且基于 YouTube-VOS 数据集引入了一个新的具有挑战性和大规模的视频修复数据集,该数据集使用了几种更近期的修复方法。结果显示了我们的方法在域内和跨域评估场景中的优越性。
Apr, 2024
设计了一种具有优秀鲁棒性和泛化能力的受信任的视频修复定位网络(TruVIL),通过深度关注噪声学习多个阶段以捕捉修复痕迹,通过交叉模态关注融合模块探索两种互补模态之间的相关性,通过关注噪声解码模块选择性增强空间细节,实验证明了 TruVIL 相对于现有技术的卓越性能。
Jun, 2024
通过深度学习,对于图像和视频修复的基于深度学习的方法进行综合评述,并从高水平的修复流程、深度学习架构、模块设计等多个角度进行分类总结。同时,讨论了训练目标、常见基准数据集、评估指标以及各修复方法的优势、局限性及实际应用,并探讨了公开挑战和未来可能的研究方向。
Jan, 2024
基于对比学习的 Video Inpainting LOcalization (ViLocal) 方案使用 3D Uniformer 编码器学习了有效的时空取证特征,通过吸引 / 排斥正 / 负原始和伪造像素对捕捉到了图像修复不一致,然后通过专门的两阶段训练策略利用轻量级卷积解码器生成了一个像素级修复定位地图,实验证明 ViLocal 优于现有技术。
Jun, 2024
利用深度学习构建了 Copy-and-Paste Networks 模型,以实现视频修复和增强,能够从与目标帧对应的参考帧中复制相关内容并粘贴填充,从而提高视频修复效果和车道检测精度。
Aug, 2019
提出了一种新颖的视频修复算法,通过 Deep Image Prior(DIP)推出的卷积网络,同时生成缺失的外观和光流信息,并采用一种无需先验训练的生成式方法进行修复。该方法具有良好的视觉效果和长期一致性。
Sep, 2019
这篇论文通过分析视频修复技术的最新进展,探讨了计算机视觉和人工智能中的一个关键领域。论文通过人工评估和计算资源比较综合考虑视觉质量和计算效率之间的平衡,并为未来探索这个充满活力和不断发展的领域提供了指导。
Jan, 2024
本文提出了一种新颖的视频修复方法,使用 Deep Flow Completion 网络综合光流场来引导像素填充,从而保证了视频内容的时空连贯性,并在 DAVIS 和 YouTube-VOS 数据集上取得了最优的修复质量和速度。
May, 2019