Sep, 2023

STEP -- 面向结构化场景文本检测

TL;DR我们介绍了结构化场景文本定位任务,该任务要求场景文本 OCR 系统根据查询正则表达式在野外定位文本。为了解决这个任务,我们提出了 Structured TExt sPotter(STEP)模型,该模型利用提供的文本结构来指导 OCR 过程。我们的方法能够准确地在各种实际阅读场景中零样本结构化文本定位,并且仅使用公开可用的数据进行训练。