通过使用 Unfolder 算法,可以对折叠的文件图像进行准确的矫正和识别,达到了低于 0.33 的识别错误率。
Dec, 2023
DocScanner 是一个新颖的文件图像矫正框架,它维护了单个矫正图像的估计,并通过一种递归机制进行了逐步纠正。基于几何先验,还引入了一种几何规则化来进一步提高纠正质量,并在 Doc3D 数据集和 DocUNet 基准数据集上进行了广泛实验,结果表明 DocScanner 在 OCR 准确性、图像相似度以及所提出的扭曲度量上优于先前方法,并表现出优越的运行时延和模型大小。
Oct, 2021
通过使用局部快速行进方案和将快速行进覆盖区域分成两个子区域的方法,我们提出了一种提取 2D 流形的新方法,该方法可应用于自动传播和交互分析,并在包括折叠的银纸和纸张在内的人工数据和真实数据上证明了我们方法的适用性和鲁棒性。
Aug, 2023
该研究介绍了一种新的文档矫正方法 —— 内容感知矫正算法(Content Aware Rectification using Angle Supervision, CREASE),该算法通过利用文档内容、单词位置及其方向等信号来辅助矫正,采用一种新颖的基于像素角度回归的方法和曲率估计,优化了文档矫正模型。与之前的方法相比,它在 OCR 准确性、几何误差和视觉相似度方面有明显的优势。
Aug, 2020
本文介绍了基于矩形化的文字识别方法的一些技巧,使其在曲线文本数据集上表现出色,并在 ICDAR 2019 任意形状文本挑战中获得了较高的准确性。
Aug, 2019
本文介绍了一种使用智能手机应用程序实现纸质收据数字化的全新方法,并提出了利用单次射击检测 MobileNet 目标检测模型来可靠地检测纸质收据四个角落位置的创新解决方案。
Mar, 2023
本文提出一种简单而有效的方法,通过估计控制点和参考点,在控制点和参考点之间采用插值方法,将稀疏映射转换为反向映射,并将原始扭曲的文档图像映射到矫正后的图像,从而矫正文档图像。实验表明,我们的方法能够矫正各种扭曲类型的文档图像,并在真实数据集上实现最先进的性能。文章还提供了一个用于文档去除畸变的控制点训练数据集。
Mar, 2022
本文提出了一种基于约束优化的方法来解决文档图像去畸变的问题,该方法考虑了文本行和文档边界,并引入了一种新的网格正则化策略来提高可读性,并在 DocUNet 基准测试中取得了最好的图像质量。
本文介绍了一种用于无限制文档图像修正的新型统一框架 DocTr++,并阐明了其在多方面方面的技术改进和应用优势,这是第一个学习为基础的方法用于无限制文档图像纠正。
Apr, 2023
本文提出了一种新的微分单应矩阵,能够在滚动快门摄像机中考虑不同的扫描线相机姿态,并演示其在进行 RS 感知的图像拼接和矫正方面的实际应用。