折叠文档的多视角矫正

Jun, 2016

Multiview Rectification of Folded Documents

Shaodi You, Yasuyuki Matsushita, Sudipta Sinha, Yusuke Bou, Katsushi Ikeuchi

TL;DR该论文介绍了一种基于发展曲面模型的图像矫正方法，可以自动地从多个视角捕获的几张图像中矫正曲折或折叠的纸张，并取得了对书页、折叠信件和购物收据等纸张表面重建并矫正的良好效果。

Abstract

digitally unwrapping images of paper sheets is crucial for accurate document scanning and text recognition. This paper presents a method f

digitally unwrapping paper sheets text recognition developable surfaces 3d reconstruction

发现论文，激发创造

Unfolder：折叠文件的快速定位与图像矫正

通过使用 Unfolder 算法，可以对折叠的文件图像进行准确的矫正和识别，达到了低于 0.33 的识别错误率。

Dec, 2023

DocScanner: 具有渐进式学习的鲁棒性文档图像矫正

DocScanner 是一个新颖的文件图像矫正框架，它维护了单个矫正图像的估计，并通过一种递归机制进行了逐步纠正。基于几何先验，还引入了一种几何规则化来进一步提高纠正质量，并在 Doc3D 数据集和 DocUNet 基准数据集上进行了广泛实验，结果表明 DocScanner 在 OCR 准确性、图像相似度以及所提出的扭曲度量上优于先前方法，并表现出优越的运行时延和模型大小。

Oct, 2021

从强曲面和折叠薄层结构中提取 2D 流形的本地迭代方法

通过使用局部快速行进方案和将快速行进覆盖区域分成两个子区域的方法，我们提出了一种提取 2D 流形的新方法，该方法可应用于自动传播和交互分析，并在包括折叠的银纸和纸张在内的人工数据和真实数据上证明了我们方法的适用性和鲁棒性。

Aug, 2023

使用角度监督的内容感知矫正

该研究介绍了一种新的文档矫正方法 —— 内容感知矫正算法（Content Aware Rectification using Angle Supervision, CREASE），该算法通过利用文档内容、单词位置及其方向等信号来辅助矫正，采用一种新颖的基于像素角度回归的方法和曲率估计，优化了文档矫正模型。与之前的方法相比，它在 OCR 准确性、几何误差和视觉相似度方面有明显的优势。

Aug, 2020

重新思考不规则场景文本识别

本文介绍了基于矩形化的文字识别方法的一些技巧，使其在曲线文本数据集上表现出色，并在 ICDAR 2019 任意形状文本挑战中获得了较高的准确性。

Aug, 2019

智能手机纸质收据的自动检测和矫正

本文介绍了一种使用智能手机应用程序实现纸质收据数字化的全新方法，并提出了利用单次射击检测 MobileNet 目标检测模型来可靠地检测纸质收据四个角落位置的创新解决方案。

Mar, 2023

控制点文档去除变形

本文提出一种简单而有效的方法，通过估计控制点和参考点，在控制点和参考点之间采用插值方法，将稀疏映射转换为反向映射，并将原始扭曲的文档图像映射到矫正后的图像，从而矫正文档图像。实验表明，我们的方法能够矫正各种扭曲类型的文档图像，并在真实数据集上实现最先进的性能。文章还提供了一个用于文档去除畸变的控制点训练数据集。

Mar, 2022

网格规则化重新审视文档图像去畸变

本文提出了一种基于约束优化的方法来解决文档图像去畸变的问题，该方法考虑了文本行和文档边界，并引入了一种新的网格正则化策略来提高可读性，并在 DocUNet 基准测试中取得了最好的图像质量。

Mar, 2022

深度无限制文档图像矫正

本文介绍了一种用于无限制文档图像修正的新型统一框架 DocTr++，并阐明了其在多方面方面的技术改进和应用优势，这是第一个学习为基础的方法用于无限制文档图像纠正。

Apr, 2023

手持相机图像拼接和矫正

本文提出了一种新的微分单应矩阵，能够在滚动快门摄像机中考虑不同的扫描线相机姿态，并演示其在进行 RS 感知的图像拼接和矫正方面的实际应用。

Aug, 2020