Oct, 2023

用于联合文本检测与布局分析的层级文本识别

TL;DR我们提出了一种名为层级文本识别器(HTS)的新方法,用于识别图像中的文本并确定其字符、单词、行和段落的四级层级结构。HTS 通过两个新颖组件实现:(1) 统一检测器多边形(UDP),可以生成文本行的贝塞尔曲线多边形以及用于检测线之间自然分组的亲和矩阵;(2) 行 - 字符 - 单词(L2C2W)识别器,可以将行分割为字符,再将它们组合成单词。HTS 在多个单词级文本识别基准数据集以及几何布局分析任务中取得了最先进的结果。