傅立叶文档恢复实现持久文档矫正和识别

CVPRMar, 2022

傅立叶文档恢复实现持久文档矫正和识别

Fourier Document Restoration for Robust Document Dewarping and Recognition

Chuhui Xue, Zichen Tian, Fangneng Zhan, Shijian Lu, Song Bai

TL;DR本文介绍了一种名为 FDRNet 的基于傅里叶变换的文档恢复网络，采用弹性薄板样条插值（Thin Plate Spline）技术对文档进行去形变，可以提高文档识别的准确性。该算法能够处理多种变形效果并在文本识别任务方面实现显著优于现有技术的性能。

Abstract

State-of-the-art document dewarping techniques learn to predict 3-dimensional information of documents which are prone to errors while dealing with documents with irregular distortions or large variations in depth. This paper presents →

document dewarping fdrnet fourier document restoration network thin-plate spline transformation document recognition

发现论文，激发创造

使用全卷积网络估计位移流进行文档图像去扭曲

通过全卷积神经网络 (FCN) 估算像素位移来实现文档图像矫正与背景消除，我们提出了一种新的框架来估算像素位移，训练 FCN 通过回归失真文档的位移，我们提出了局部平滑约束（LSC）作为正则化以控制平滑度。实验表明，我们的方法在各种几何失真下可有效去除文档图像畸变，并在局部细节和总体效果上取得了最先进的性能。

Apr, 2021

网格规则化重新审视文档图像去畸变

本文提出了一种基于约束优化的方法来解决文档图像去畸变的问题，该方法考虑了文本行和文档边界，并引入了一种新的网格正则化策略来提高可读性，并在 DocUNet 基准测试中取得了最好的图像质量。

Mar, 2022

学习变形引导的盲目人脸修复

本文研究了盲目还原面部图像的问题，通过使用高品质引导图像及 WarpNet 网络来修正姿势、光照和表情等因素对面部细节的影响，同时使用 CNN 和 Synthetic 数据来完成盲目还原任务。

Apr, 2018

学习频率感知的动态变换器用于一体化图像恢复

该研究提出了一种全方位图像恢复方法，通过从频率角度出发，利用先进的视觉变换器来处理多种类型的退化，以提取图像的退化表示并引导模型适应性地恢复退化的图像。实验证明，该方法在去噪、去雨、去雾和去模糊等四个典型恢复任务中优于现有方法，并且能够处理空间变异的退化和未知退化水平。

Jun, 2024

EDVR: 基于增强型可变形卷积网络的视频修复

视频修复项目，涉及超分辨率、去模糊等多个任务。本文提出了一种名为 EDVR 的基于增强可变形网络的视频修复框架，通过金字塔级别的可变形卷积对齐帧以及时间空间注意力融合模块对图像进行处理，取得了 NTIRE19 视觉修复挑战的所有四个任务的冠军，并在视频超分辨率和去模糊方面表现优异。

May, 2019

深度多尺度分量字典盲目人脸修复

该论文提出了一种深度字典网络（称为 DFDNet），用于参考基础面部修复方法中没有限制同一身份高质量参考图像的场景，并通过字典功能转移块从高质量图像中生成字典以修复真实降质图像上的细节。

Aug, 2020

Fourier-Net：带限变形的快速图像配准

本文提出 Fourier-Net 网络，使用参数自由的基于模型的解码器代替 U-Net 风格网络的扩张路径。将低维度表示在带限傅里叶域中进行学习，最后由模型驱动的解码器解码为完整的空间域中的密集位移场。与现有方法相比，我们的 Fourier-Net 网络具有更少的参数和更快的推理速度，在公共 3D 脑数据集上实现了更高的 Dice 得分和更快的推理速度。

Nov, 2022

使用基于模型驱动的深度学习架构从少量扩散加权影像中恢复高质量的 FOD

通过使用深度学习进行纤维定向分布的重建，可以从减少的扩散加权图像中产生准确的纤维定向分布，从而减少总体成像时间，并提出了用于保证深度学习网络中间输出与输入扩散加权图像一致性的球形反卷积网络模型驱动的纤维定向分布重建架构。

Jul, 2023

基于 3D 可变形网格模型和光流的结构密集位移网络

本研究提出了一个网络，通过单目摄像头识别 RC 框架结构的位移。该网络由 FlowNet2 和 POFRN-Net 两个模块组成，FlowNet2 用于生成稠密光流，POFRN-Net 用于提取姿态参数 H。该研究展示了对第一视频的真实位移进行的对比，并展示了给定三个视频中 RC 框架结构的四个楼层的预测位移。

Feb, 2024

学习一种用于图像恢复的粗到细扩散变压器

提出了一种粗糙到精细扩散变换器（C2F-DFT）用于图像恢复，它包含粗糙到精细的训练模式、扩散自注意力和扩散前馈网络，并在去噪、去模糊和真实降噪三个任务上显著优于 IR-SDE 等扩散模型，并与基于变压器的现有方法表现出竞争性能。

Aug, 2023