Jun, 2024

SegHist: 一种基于分割的中国历史文档文本行检测框架

TL;DR提出了一种通用的历史文档文本检测框架(SegHist),结合 DB++ 方法实现了 DB-SegHist,以应对历史文档分割为基础的文本检测方法在处理高宽比文本行等挑战时的有效性,取得了在 CHDAC、MTHv2 和 HDRC 数据集上的最新技术水平以及在 CHDAC 数据集上高宽比文本行更好的结果,在旋转 MTHv2 和旋转 HDRC 数据集上也达到了最新技术水平,具备旋转鲁棒性。