Aug, 2022

一种基于 Transformer 模型的端到端 OCR 框架,用于识别具有变音符的大规模古典阿拉伯文多字体语料库的手写体 Arabic 识别

TL;DR本文介绍了针对阿拉伯历史文献的光学字符识别技术的研究,提出了一种端到端文本识别方法 BEIT,并通过实验比较证明,该方法优于卷积神经网络的特征提取方法,达到了 4.46% 的识别准确率。