完全卷积神经网络实现的文件图像二值化

Aug, 2017

完全卷积神经网络实现的文件图像二值化

Document Image Binarization with Fully Convolutional Neural Networks

Chris Tensmeyer, Tony Martinez

TL;DR该研究论文介绍了一种基于全卷积网络的二值化方法，该方法在历史手稿图像及其他领域如棕榈叶手稿的二值化任务中具有良好的性能表现，并在多个指标上优于竞争对手。作者还分析了不同超参数、数据集及输入特征对算法性能的影响。

Abstract

binarization of degraded historical manuscript images is an important pre-processing step for many document processing tasks. We formulate binari

binarization historical manuscript images convolutional network pseudo f-measure metric dibco competitions

发现论文，激发创造

历史文献图像页面分割的全卷积神经网络

本文提出了一种基于像素级别处理的高性能全卷积神经网络，用于历史文献图像分割，并引入了一种独立于模糊真实度量的前景像素准确度评价指标，该指标仅计算二值化页面中的前景像素，从而使研究人员可以比较不同的分割方法在文本或图像分割方面的成功能力。

Nov, 2017

各种基于深度学习的文档图像二值化方法的公正评估

文档图像二值化是文档分析领域重要的预处理步骤，但没有进行系统比较。本研究通过相同评估协议评估了不同深度学习方法在各种 DIBCO 数据集上的表现，发现 DE-GAN 在 DIBCO2013 数据集上效果最好，DP-LinkNet 在 DIBCO2017 数据集上表现最佳，2-StageGAN 在 DIBCO2018 数据集上表现最佳，SauvolaNet 在 DIBCO2019 数据集上胜过其他方法。为了保证可重现性并简化未来的二值化评估，我们公开了代码、所有模型和评估。

Jan, 2024

基于双鉴别器生成对抗网络的 JPEG 压缩域文档图像二值化

本文提出了一种直接使用 JPEG 压缩流进行文档图像二值化的方法，采用 Dual Discriminator 生成对抗网络，在包含噪声和失真的情况下，经过全面的测试，结果表明该模型具有高度的鲁棒性和效率，同时在 JPEG 压缩领域表现出最先进的性能。

Sep, 2022

利用空间和频率的二值化文件处理

基于快速傅里叶卷积，提出了一种能够处理文档图像二值化问题的替代方案，克服了标准卷积在建模全局信息方面的局限性，同时比 Vision Transformer 需要更少的参数。

Apr, 2024

使用完全卷积网络识别具有挑战性的手写注释

本文介绍一个历史德语文件的数据集，并使用全卷积神经网络（FCNN）方法来定位这些文件中的手写注释，研究训练和评估了各种各样的端到端语义分割方法，并报告了结果，最佳模型可以在测试文档中获得 95.6％的平均交集联合得分（IoU）。

Apr, 2018

不同文件图像二值化方法的分析研究

本文研究文档图像的二值化处理及其在识别、算法优化等方面的应用。通过比较已有算法的优缺点，对其进行修改以达到更好的时间或表现。

Jan, 2015

精度生物医学图像分割的完全卷积网络量化

本文旨在探讨量化技术在深度神经网络（DNN）和全卷积神经网络（FCN）的生物医学图像分割中的应用，而不是仅仅将其用于降低内存和计算复杂度。实验结果表明，在 MICCAI Gland 数据集上，我们的方法不仅优于现有的技术，而且可以使内存使用降低多达 6.4 倍。

Mar, 2018

DocBinFormer：一种用于有效文档图像二值化的两级 Transformer 网络

提出了一种名为 DocBinFormer（文档二值化变换器）的基于视觉变换器的两级架构，用于有效地对文档图像进行二值化分析，该架构利用双级变换器编码器从输入图像中有效地捕获全局和局部特征表示，从而在系统生成和手写文档图像的分析中取得了改进的结果，并在 DIBCO 和 H-DIBCO 基准数据集上超过了现有技术的表现。

Dec, 2023

DeepOTSU：使用迭代深度学习进行文档增强和二值化

本文提出了一种新的迭代深度学习框架，并将其应用于文档增强和二值化。通过学习文档图像中的退化过程，该网络能够逐步细化输出，实现文档增强。通过在全局或本地阈值下使用增强的图像，可以获得二值化图。实验结果表明，所提出的方法适用于可视化和基于 Otsu 阈值的二值化处理。

Jan, 2019

用于历史文档图像页面分割的卷积神经网络

本文提出了一种基于卷积神经网络的手写历史文档图像页面分割方法，将页面分割视为像素标记问题，使用卷积神经网络从原始图像像素中学习特征，经实验验证，在不同的公共数据集上，该方法对比之前的方法，取得了更加有效和卓越的结果。

Apr, 2017