傅立叶文档恢复实现持久文档矫正和识别
通过全卷积神经网络 (FCN) 估算像素位移来实现文档图像矫正与背景消除,我们提出了一种新的框架来估算像素位移,训练 FCN 通过回归失真文档的位移,我们提出了局部平滑约束(LSC)作为正则化以控制平滑度。实验表明,我们的方法在各种几何失真下可有效去除文档图像畸变,并在局部细节和总体效果上取得了最先进的性能。
Apr, 2021
本文提出了一种基于约束优化的方法来解决文档图像去畸变的问题,该方法考虑了文本行和文档边界,并引入了一种新的网格正则化策略来提高可读性,并在 DocUNet 基准测试中取得了最好的图像质量。
Mar, 2022
本文研究了盲目还原面部图像的问题,通过使用高品质引导图像及 WarpNet 网络来修正姿势、光照和表情等因素对面部细节的影响,同时使用 CNN 和 Synthetic 数据来完成盲目还原任务。
Apr, 2018
该研究提出了一种全方位图像恢复方法,通过从频率角度出发,利用先进的视觉变换器来处理多种类型的退化,以提取图像的退化表示并引导模型适应性地恢复退化的图像。实验证明,该方法在去噪、去雨、去雾和去模糊等四个典型恢复任务中优于现有方法,并且能够处理空间变异的退化和未知退化水平。
Jun, 2024
视频修复项目,涉及超分辨率、去模糊等多个任务。本文提出了一种名为 EDVR 的基于增强可变形网络的视频修复框架,通过金字塔级别的可变形卷积对齐帧以及时间空间注意力融合模块对图像进行处理,取得了 NTIRE19 视觉修复挑战的所有四个任务的冠军,并在视频超分辨率和去模糊方面表现优异。
May, 2019
该论文提出了一种深度字典网络(称为 DFDNet),用于参考基础面部修复方法中没有限制同一身份高质量参考图像的场景,并通过字典功能转移块从高质量图像中生成字典以修复真实降质图像上的细节。
Aug, 2020
本文提出 Fourier-Net 网络,使用参数自由的基于模型的解码器代替 U-Net 风格网络的扩张路径。将低维度表示在带限傅里叶域中进行学习,最后由模型驱动的解码器解码为完整的空间域中的密集位移场。与现有方法相比,我们的 Fourier-Net 网络具有更少的参数和更快的推理速度,在公共 3D 脑数据集上实现了更高的 Dice 得分和更快的推理速度。
Nov, 2022
通过使用深度学习进行纤维定向分布的重建,可以从减少的扩散加权图像中产生准确的纤维定向分布,从而减少总体成像时间,并提出了用于保证深度学习网络中间输出与输入扩散加权图像一致性的球形反卷积网络模型驱动的纤维定向分布重建架构。
Jul, 2023
本研究提出了一个网络,通过单目摄像头识别 RC 框架结构的位移。该网络由 FlowNet2 和 POFRN-Net 两个模块组成,FlowNet2 用于生成稠密光流,POFRN-Net 用于提取姿态参数 H。该研究展示了对第一视频的真实位移进行的对比,并展示了给定三个视频中 RC 框架结构的四个楼层的预测位移。
Feb, 2024
提出了一种粗糙到精细扩散变换器(C2F-DFT)用于图像恢复,它包含粗糙到精细的训练模式、扩散自注意力和扩散前馈网络,并在去噪、去模糊和真实降噪三个任务上显著优于 IR-SDE 等扩散模型,并与基于变压器的现有方法表现出竞争性能。
Aug, 2023