AAAIFeb, 2022
DocBed: 用于复杂版面文档的多阶段 OCR 解决方案
DocBed: A Multi-Stage OCR Solution for Documents with Complex Layouts
Wenzhen Zhu, Negin Sokhandan, Guang Yang, Sujitha Martin, Suchitra Sathyanarayana
TL;DR本文介绍了基于数字化报纸的复杂布局分析的挑战及其解决方法,其中提供了一个覆盖 21 个州、3000 张真实报纸图像的数据集,探索了多种前沿分割模型和后处理方法,以实现对报纸的数字化,并提供了结构化评估方法。