Feb, 2024

开源阿拉伯文字光学字符识别的进展与限制:以案例研究为例

TL;DR这篇研究论文主要探讨了开源OCR引擎Kraken在阿拉伯文学期刊al-Abhath上的准确性研究。通过与其他商业OCR引擎的对比,研究表明Kraken能够产生高度精确的阿拉伯文OCR。论文还评估了具有特定字体和通用模型在al-Abhath数据上的相对准确性,并对OCR错误识别的上下文特征进行了微观分析。基于这些分析,论文提出了通过更系统的培训数据生成方法和开发关键技术组件(尤其是多语言模型、改进的行分割和布局分析)来显著提高阿拉伯文OCR的观点。