Unfolder：折叠文件的快速定位与图像矫正

Dec, 2023

Unfolder：折叠文件的快速定位与图像矫正

Unfolder: Fast localization and image rectification of a document with a crease from folding in half

A. M. Ershov, D. V. Tropin, E. E. Limonova, D. P. Nikolaev, V. V. Arlazarov

TL;DR通过使用Unfolder算法，可以对折叠的文件图像进行准确的矫正和识别，达到了低于0.33的识别错误率。

Abstract

Presentation of folded documents is not an uncommon case in modern society. digitizing such documents by capturing them with a smartphone camera can be tricky since a crease can divide the document contents into

发现论文，激发创造

折叠文档的多视角矫正

该论文介绍了一种基于发展曲面模型的图像矫正方法，可以自动地从多个视角捕获的几张图像中矫正曲折或折叠的纸张，并取得了对书页、折叠信件和购物收据等纸张表面重建并矫正的良好效果。

Jun, 2016

基于Patch的CNN文档矫正和光照校正

本研究提出了一种新的学习方法来纠正单个输入图像中具有各种扭曲类型的文档图像，特别是在图像补丁上首先学习了扭曲流，通过在梯度域中处理拼接结果将其缝合到矫正的文档中，提出了第二个网络来纠正不均匀的光照，从而在合成和真实数据集中显着提高了整体准确性。

Sep, 2019

文档图像去扭曲的门控和叉分堆叠 U-Net 模块

本文提出了一种基于深度学习的 Gated and Bifurcated Stacked U-Net 的方法，用于去除手持设备捕捉的文档图像中的失真，并在大幅减少所需数据量的情况下，在 DocUNet 数据集上实现了最先进的性能。

Jul, 2020

使用角度监督的内容感知矫正

该研究介绍了一种新的文档矫正方法—— 内容感知矫正算法（Content Aware Rectification using Angle Supervision, CREASE），该算法通过利用文档内容、单词位置及其方向等信号来辅助矫正，采用一种新颖的基于像素角度回归的方法和曲率估计，优化了文档矫正模型。与之前的方法相比，它在OCR准确性、几何误差和视觉相似度方面有明显的优势。

Aug, 2020

DocScanner: 具有渐进式学习的鲁棒性文档图像矫正

DocScanner是一个新颖的文件图像矫正框架，它维护了单个矫正图像的估计，并通过一种递归机制进行了逐步纠正。基于几何先验，还引入了一种几何规则化来进一步提高纠正质量，并在Doc3D数据集和DocUNet基准数据集上进行了广泛实验，结果表明DocScanner在OCR准确性、图像相似度以及所提出的扭曲度量上优于先前方法，并表现出优越的运行时延和模型大小。

Oct, 2021

文档图像矫正的几何表征学习

DocGeoNet通过引入明确的几何表示来进行文档图像纠正，其中涉及文档图像的两个典型属性：3D形状和文本行。

Oct, 2022

智能手机纸质收据的自动检测和矫正

本文介绍了一种使用智能手机应用程序实现纸质收据数字化的全新方法，并提出了利用单次射击检测MobileNet目标检测模型来可靠地检测纸质收据四个角落位置的创新解决方案。

Mar, 2023

深度无限制文档图像矫正

本文介绍了一种用于无限制文档图像修正的新型统一框架DocTr++，并阐明了其在多方面方面的技术改进和应用优势，这是第一个学习为基础的方法用于无限制文档图像纠正。

Apr, 2023

DocMAE: 基于自监督表示学习的文档图像矫正

本文提出了一个名为DocMAE的自监督框架来学习文本图像校正问题中的有效信息表示，通过利用掩模自编码器编码文本图像的结构线索来使文本图像校正受益。

Apr, 2023

DocBinFormer：一种用于有效文档图像二值化的两级Transformer网络

提出了一种名为DocBinFormer（文档二值化变换器）的基于视觉变换器的两级架构，用于有效地对文档图像进行二值化分析，该架构利用双级变换器编码器从输入图像中有效地捕获全局和局部特征表示，从而在系统生成和手写文档图像的分析中取得了改进的结果，并在DIBCO和H-DIBCO基准数据集上超过了现有技术的表现。

Dec, 2023