Jan, 2024

各种基于深度学习的文档图像二值化方法的公正评估

TL;DR文档图像二值化是文档分析领域重要的预处理步骤,但没有进行系统比较。本研究通过相同评估协议评估了不同深度学习方法在各种 DIBCO 数据集上的表现,发现 DE-GAN 在 DIBCO2013 数据集上效果最好,DP-LinkNet 在 DIBCO2017 数据集上表现最佳,2-StageGAN 在 DIBCO2018 数据集上表现最佳,SauvolaNet 在 DIBCO2019 数据集上胜过其他方法。为了保证可重现性并简化未来的二值化评估,我们公开了代码、所有模型和评估。