Mar, 2024

LOCR:基于位置引导的光学字符识别 Transformer

TL;DR教育文档的光学字符识别 (OCR) 模型 LOCR,通过在自回归过程中将位置引导集成到变压器架构中,有效地解决了复杂布局文档中的重复问题,提高了准确性,同时还提供了交互式 OCR 模式。