使用卷积神经网络的手写体识别
利用卷积神经网络(CNNs)对非母语使用者书写的英文字母进行分类识别,借助 HIEC 数据集训练了一个定制的 CNN 模型,并通过调整超参数进行了消融研究,结果显示该模型在字符识别准确性方面优于其他模型,达到了 97.04% 的准确度,相对于次优模型提升了 4.38%。
Jun, 2024
本篇综述研究了手写文字光学字符识别技术及其研究方向,通过人工智能和机器学习工具将手写和印刷文件转化为可分析、可编辑和可搜索的电子数据。共收集 142 篇相关研究,总结了最新的 OCR 技术和研究方向。
Jan, 2020
本文研究基于深度学习的方法在离线手写中文文本识别领域的应用,使用只有卷积神经网络的模型和 CTC 损失函数实现,采用 Dropout 方法以防止过拟合,最终在 ICDAR 2013 竞赛数据集上实现了 6.81% 的字符错误率,为同等条件下最好的研究结果。
Jun, 2020
本文提出了一种名为 TrOCR 的端到端文本识别方法,其中使用了预训练的图像 Transformer 和文本 Transformer 模型,不仅适用于印刷体和手写体,还适用于场景文本识别任务,并在准确率方面优于当前最先进的模型。
Sep, 2021
本研究提出了一种基于循环神经网络和卷积神经网络的光学字符识别错误自动纠正方法,针对历史藏书文献的 OCR 后置处理,以很高的效率在德语历史图书文献语料库中降低了字符误差率 32.3%以上。
Feb, 2021
提出了一种使用自然语言处理(NLP)工具的后处理方法,在手写或打印文本上先进行光学字符识别(OCR),然后使用 NLP 提高其准确性。
Jul, 2023
光学字符识别 (OCR) 是一个重要的过程,它涉及从扫描或打印图像中提取手写或印刷文字,将其转换为机器能够理解和处理的格式。本文旨在全面审查与阿拉伯光学字符识别 (OCR) 相关的当代应用、方法和挑战。通过对 OCR 过程中常用的技术进行彻底分析,着力寻找表现出更好结果的最有效方法。本文采用了细致的关键词搜索方法,对与阿拉伯 OCR 相关的文章进行全面分析,包括对前后引文的审查。除了展示最新的技术和方法,本文批判性地确定了阿拉伯 OCR 领域的研究空白,通过突出这些空白为未来的探索和发展指明了有前途的方向。本研究的结果为从事阿拉伯 OCR 的研究人员、实践者和利益相关者提供了宝贵的见解,最终促进了该领域的进步,并为阿拉伯语言的 OCR 系统的创建提供了更准确和高效的条件。
Dec, 2023
文章提出了一种数据高效,端到端的神经网络模型用于通用的非受限文本识别,并通过在七个公共数据集上达到最优结果,表明了这种模型的通用性和优越性。
Dec, 2018
本研究基于卷积神经网络(CNN)提出了一种针对儿童阿拉伯手写字符识别的模型,其精度在 Hijja 数据集上为 91%,在阿拉伯手写字符数据集上为 97%,并提出了一种基于笔画数的多模型方法,融合 Hijja 和 AHCD,平均预测准确率达到 96%。
Nov, 2022