Jan, 2023

SPTS v2:单点场景文本检测

TL;DR本文提出了 SPTS v2 框架,采用单点注释作为代替传统文本检测与识别的昂贵手工注释方法。采用基于自回归 Transformer 的 IAD 对同一预测序列内所有文本实例的中心点进行预测,采用 PRD 进行文本识别。详细实验结果证明该方法可超越现有单点文本定位器的性能而实现 14 倍更快的推断速度。同时,实验还进一步展示了单点注释比非点注释和多边形边界框更为适合场景文本识别。