AAAIFeb, 2022

DocBed: 用于复杂版面文档的多阶段 OCR 解决方案

TL;DR本文介绍了基于数字化报纸的复杂布局分析的挑战及其解决方法,其中提供了一个覆盖 21 个州、3000 张真实报纸图像的数据集,探索了多种前沿分割模型和后处理方法,以实现对报纸的数字化,并提供了结构化评估方法。