Mar, 2024
LOCR:基于位置引导的光学字符识别 Transformer
LOCR: Location-Guided Transformer for Optical Character Recognition
Yu Sun, Dongzhan Zhou, Chen Lin, Conghui He, Wanli Ouyang...
TL;DR教育文档的光学字符识别 (OCR) 模型 LOCR,通过在自回归过程中将位置引导集成到变压器架构中,有效地解决了复杂布局文档中的重复问题,提高了准确性,同时还提供了交互式 OCR 模式。