Unfolder:折叠文件的快速定位与图像矫正
该论文介绍了一种基于发展曲面模型的图像矫正方法,可以自动地从多个视角捕获的几张图像中矫正曲折或折叠的纸张,并取得了对书页、折叠信件和购物收据等纸张表面重建并矫正的良好效果。
Jun, 2016
本研究提出了一种新的学习方法来纠正单个输入图像中具有各种扭曲类型的文档图像,特别是在图像补丁上首先学习了扭曲流,通过在梯度域中处理拼接结果将其缝合到矫正的文档中,提出了第二个网络来纠正不均匀的光照,从而在合成和真实数据集中显着提高了整体准确性。
Sep, 2019
本文提出了一种基于深度学习的 Gated and Bifurcated Stacked U-Net 的方法,用于去除手持设备捕捉的文档图像中的失真,并在大幅减少所需数据量的情况下,在 DocUNet 数据集上实现了最先进的性能。
Jul, 2020
该研究介绍了一种新的文档矫正方法—— 内容感知矫正算法(Content Aware Rectification using Angle Supervision, CREASE),该算法通过利用文档内容、单词位置及其方向等信号来辅助矫正,采用一种新颖的基于像素角度回归的方法和曲率估计,优化了文档矫正模型。与之前的方法相比,它在OCR准确性、几何误差和视觉相似度方面有明显的优势。
Aug, 2020
DocScanner是一个新颖的文件图像矫正框架,它维护了单个矫正图像的估计,并通过一种递归机制进行了逐步纠正。基于几何先验,还引入了一种几何规则化来进一步提高纠正质量,并在Doc3D数据集和DocUNet基准数据集上进行了广泛实验,结果表明DocScanner在OCR准确性、图像相似度以及所提出的扭曲度量上优于先前方法,并表现出优越的运行时延和模型大小。
Oct, 2021
本文介绍了一种使用智能手机应用程序实现纸质收据数字化的全新方法,并提出了利用单次射击检测MobileNet目标检测模型来可靠地检测纸质收据四个角落位置的创新解决方案。
Mar, 2023
本文介绍了一种用于无限制文档图像修正的新型统一框架DocTr++,并阐明了其在多方面方面的技术改进和应用优势,这是第一个学习为基础的方法用于无限制文档图像纠正。
Apr, 2023
本文提出了一个名为DocMAE的自监督框架来学习文本图像校正问题中的有效信息表示,通过利用掩模自编码器编码文本图像的结构线索来使文本图像校正受益。
Apr, 2023
提出了一种名为DocBinFormer(文档二值化变换器)的基于视觉变换器的两级架构,用于有效地对文档图像进行二值化分析,该架构利用双级变换器编码器从输入图像中有效地捕获全局和局部特征表示,从而在系统生成和手写文档图像的分析中取得了改进的结果,并在DIBCO和H-DIBCO基准数据集上超过了现有技术的表现。
Dec, 2023