本文提出了一种基于像素级别处理的高性能全卷积神经网络,用于历史文献图像分割,并引入了一种独立于模糊真实度量的前景像素准确度评价指标,该指标仅计算二值化页面中的前景像素,从而使研究人员可以比较不同的分割方法在文本或图像分割方面的成功能力。
Nov, 2017
文档图像二值化是文档分析领域重要的预处理步骤,但没有进行系统比较。本研究通过相同评估协议评估了不同深度学习方法在各种 DIBCO 数据集上的表现,发现 DE-GAN 在 DIBCO2013 数据集上效果最好,DP-LinkNet 在 DIBCO2017 数据集上表现最佳,2-StageGAN 在 DIBCO2018 数据集上表现最佳,SauvolaNet 在 DIBCO2019 数据集上胜过其他方法。为了保证可重现性并简化未来的二值化评估,我们公开了代码、所有模型和评估。
Jan, 2024
本文提出了一种直接使用 JPEG 压缩流进行文档图像二值化的方法,采用 Dual Discriminator 生成对抗网络,在包含噪声和失真的情况下,经过全面的测试,结果表明该模型具有高度的鲁棒性和效率,同时在 JPEG 压缩领域表现出最先进的性能。
Sep, 2022
基于快速傅里叶卷积,提出了一种能够处理文档图像二值化问题的替代方案,克服了标准卷积在建模全局信息方面的局限性,同时比 Vision Transformer 需要更少的参数。
Apr, 2024
本文介绍一个历史德语文件的数据集,并使用全卷积神经网络(FCNN)方法来定位这些文件中的手写注释,研究训练和评估了各种各样的端到端语义分割方法,并报告了结果,最佳模型可以在测试文档中获得 95.6%的平均交集联合得分(IoU)。
Apr, 2018
本文研究文档图像的二值化处理及其在识别、算法优化等方面的应用。通过比较已有算法的优缺点,对其进行修改以达到更好的时间或表现。
Jan, 2015
本文旨在探讨量化技术在深度神经网络(DNN)和全卷积神经网络(FCN)的生物医学图像分割中的应用,而不是仅仅将其用于降低内存和计算复杂度。实验结果表明,在 MICCAI Gland 数据集上,我们的方法不仅优于现有的技术,而且可以使内存使用降低多达 6.4 倍。
Mar, 2018
提出了一种名为 DocBinFormer(文档二值化变换器)的基于视觉变换器的两级架构,用于有效地对文档图像进行二值化分析,该架构利用双级变换器编码器从输入图像中有效地捕获全局和局部特征表示,从而在系统生成和手写文档图像的分析中取得了改进的结果,并在 DIBCO 和 H-DIBCO 基准数据集上超过了现有技术的表现。
Dec, 2023
本文提出了一种新的迭代深度学习框架,并将其应用于文档增强和二值化。通过学习文档图像中的退化过程,该网络能够逐步细化输出,实现文档增强。通过在全局或本地阈值下使用增强的图像,可以获得二值化图。实验结果表明,所提出的方法适用于可视化和基于 Otsu 阈值的二值化处理。
Jan, 2019
本文提出了一种基于卷积神经网络的手写历史文档图像页面分割方法,将页面分割视为像素标记问题,使用卷积神经网络从原始图像像素中学习特征,经实验验证,在不同的公共数据集上,该方法对比之前的方法,取得了更加有效和卓越的结果。
Apr, 2017