基于图像的字符识别，从寺庙解码铭文的文档系统

May, 2024

基于图像的字符识别，从寺庙解码铭文的文档系统

Image Based Character Recognition, Documentation System To Decode Inscription From Temple

Velmathi G, Shangavelan M, Harish D, Krithikshun M S

TL;DR该研究训练和分析应用于位于 Brihadeeswarar Temple 墙壁上发现的 10 世纪古代泰米尔铭文的光学字符识别（OCR）方法，其中选择的 OCR 方法包括使用现代 ICR 技术预处理原始数据的 Tesseract（一种广泛使用的 OCR 引擎）和一个框编辑软件来调优我们的模型，通过 Tesseract 的分析来评估它们在准确解读古代泰米尔字符方面的有效性，我们的模型在数据集上的性能通过准确率来确定，该数据集被划分为训练集和测试集，通过解决脚本的历史背景所带来的独特挑战，该研究旨在为 OCR 领域的改进保存和解释古代铭文做出有价值的贡献。

Abstract

This project undertakes the training and analysis of optical character recognition OCR methods applied to 10th century ancient tamil inscriptions discovered on the walls of the brihadeeswarar temple.The chosen OC

optical character recognition ancient tamil inscriptions brihadeeswarar temple tesseract icr techniques

发现论文，激发创造

使用深度学习的 Telugu OCR 框架

本文针对旁遮普文字的光学字符识别任务，提出一种基于数学形态学的分割方法、深度卷积神经网络的分类模块及三次马尔可夫链式语言建模的末端至末端框架，取得了最新的错误率优化效果，并详尽阐述了深度学习实现过程中所需的众多技巧所依据的统计学理论。

Sep, 2015

基于图像处理的场景文本检测与识别：Tesseract

本研究着重于自然图像中文字的检测和识别，使用基于卡车上的摄像机捕捉图像的方法，利用 Tesseract OCR 引擎来识别检测到的文字区域。研究中讨论了测试中出现的一个重要的假阳性情况并阐述了缓解该问题的策略。最终，该项目实现了超过 80％的正确字符识别率，并概述了开发阶段、主要挑战和一些有趣的发现。

Apr, 2020

使用卷积神经网络的手写体识别

通过使用 NIST 数据集对卷积神经网络进行训练并提取图像特征，成功实现了 90.54% 的识别准确率和 2.53% 的损失，该技术可以对手写和印刷文本进行 OCR 和 ICR 的处理。

Jul, 2023

专用模型和高级技术提升孟加拉光学字符识别在多样文档类型中的应用

该研究提出了一种具有特殊能力的孟加拉语 OCR 系统，该系统在保留结构、对齐和图像的同时，在重建文档布局方面表现出色。它采用先进的图像和签名检测进行准确提取，并为文字分割提供了专门模型以适应多样化的文档类型，包括计算机排版、凸版印刷、打字机和手写文档。该系统处理静态和动态手写输入，识别各种写作风格。此外，它还能识别孟加拉语中的复合字符。广泛的数据收集工作提供了多样化的语料库，而高级技术组件优化了字符和单词识别。额外的贡献包括图像、标志、签名和表格识别，透视校正，布局重建以及用于高效和可扩展处理的排队模块。该系统在高效准确的文本提取和分析方面表现出色。

Feb, 2024

使用多层感知器识别文本图像

该篇论文介绍了如何应用神经网络和反向传播算法实现光学字符识别（OCR）并转换为可编辑机器可读的数字文本格式。

Dec, 2016

TrOCR: 基于 Transformer 的带预训练模型的光学字符识别

本文提出了一种名为 TrOCR 的端到端文本识别方法，其中使用了预训练的图像 Transformer 和文本 Transformer 模型，不仅适用于印刷体和手写体，还适用于场景文本识别任务，并在准确率方面优于当前最先进的模型。

Sep, 2021

阿拉伯光学字符识别的进展与挑战：综述

光学字符识别 (OCR) 是一个重要的过程，它涉及从扫描或打印图像中提取手写或印刷文字，将其转换为机器能够理解和处理的格式。本文旨在全面审查与阿拉伯光学字符识别 (OCR) 相关的当代应用、方法和挑战。通过对 OCR 过程中常用的技术进行彻底分析，着力寻找表现出更好结果的最有效方法。本文采用了细致的关键词搜索方法，对与阿拉伯 OCR 相关的文章进行全面分析，包括对前后引文的审查。除了展示最新的技术和方法，本文批判性地确定了阿拉伯 OCR 领域的研究空白，通过突出这些空白为未来的探索和发展指明了有前途的方向。本研究的结果为从事阿拉伯 OCR 的研究人员、实践者和利益相关者提供了宝贵的见解，最终促进了该领域的进步，并为阿拉伯语言的 OCR 系统的创建提供了更准确和高效的条件。

Dec, 2023

手写光学字符识别（OCR）：一篇全面系统性文献综述（SLR）

本篇综述研究了手写文字光学字符识别技术及其研究方向，通过人工智能和机器学习工具将手写和印刷文件转化为可分析、可编辑和可搜索的电子数据。共收集 142 篇相关研究，总结了最新的 OCR 技术和研究方向。

Jan, 2020

优化文化打字文件字符识别图像处理算法

利用多目标问题公式和非支配排序遗传算法（NSGA-II）调整参数，本文评估了在光学字符识别（OCR）应用于打字文化遗产文件时图像处理方法和参数调整的影响，并发现通过数字表示类型来针对图像预处理算法进行参数化可以提高 OCR 的性能。特别是自适应阈值法、双边滤波器和开操作是剧院封面、信件和整体数据集中表现最好的算法，应在 OCR 之前应用以提高其性能。

Nov, 2023

构建多元数字历史的高效 OCR

通过对 OCR 进行字符级图像检索建模，解决了现有体系结构在低资源情况下无法准确识别光学字符识别问题的不足，并为社区参与使数字历史更具代表性开辟了新的途径。

Apr, 2023