Dec, 2022

扩展 TrOCR 实现全页扫描收据图像的文本免定位 OCR

TL;DR本研究提出了一个基于 Transformer 的 OCR 模型,用于提取收据图像中的字符序列,无需定位文本。该模型能够在不需要额外处理的情况下,将整个收据图像中的字符识别准确,并按阅读顺序排列。