为西里尔手写文字的 OCR 后修正生成数据

Nov, 2023

为西里尔手写文字的 OCR 后修正生成数据

Data Generation for Post-OCR correction of Cyrillic handwriting

Evgenii Davydkin, Aleksandr Markelov, Egor Iuldashev, Anton Dudkin, Ivan Krivorotov

TL;DR该论文介绍了一种针对手写西里尔文文本的后光学字符识别校正（POC）的新方法，该方法利用 Bézier 曲线生成引擎生成高度逼真的手写文本，并应用手写文本识别模型识别 OCR 错误，从而进行校正。

Abstract

This paper introduces a novel approach to post-Optical Character Recognition Correction (POC) for handwritten cyrillic text, addressing a significant gap in current research methodologies. This gap is due to the lack of large text corporas that provide →

post-optical character recognition correction handwritten cyrillic text bezier curves handwritten text recognition model ocr errors

发现论文，激发创造

神经光学字符识别历史文献后处理校正

本研究提出了一种基于循环神经网络和卷积神经网络的光学字符识别错误自动纠正方法，针对历史藏书文献的 OCR 后置处理，以很高的效率在德语历史图书文献语料库中降低了字符误差率 32.3％以上。

Feb, 2021

一个可扩展的手写文本识别系统

本研究主要解决将手写文本识别能力添加到大规模多语言 OCR 系统中的难点，包括数据获取，效率和集成等三个方面，通过使用在线手写数据集和基于神经网络的线识别模型等方式解决了这些问题，实现了 HTR 能力在 OCR 系统中的集成。

Apr, 2019

针对资源匮乏语言和字母的词典来源的可扩展手写文本识别系统

本文介绍了一种解读大量手写历史词典索引卡的方法，使用一种特别设计的手写文本识别解决方案，包括优化的检测模型，SPN、RCNN 和 CTC 三种卷积神经网络结构，以及基于约束的单词匹配算法。该方法在波兰 17th-18th 世纪历史词典的 2.8 万个索引卡上取得了 0.881 的准确率，为将来的 HTR 应用提供了可行的思路。

Mar, 2023

卷积识别模型特征与文本标签相结合的离线检测错误拼写的手写词

通过引入与文本进行比较的任务，我们提出了一个无限制的二元分类器，其中包括一个手写识别特征提取器和一个多模态分类头，该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明，与直接使用最先进的手写识别模型来解决任务相比，尽管保持高回收率，但分类器可以进行校准，使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。

Sep, 2023

优化神经网络训练以用于历史希伯来文本的 OCR 错误修正

本研究通过创新方法训练一种轻量级神经网络，用于希伯来语 OCR 后处理，使用少量手动创建的数据。通过实验发现，使用所提出方法训练的网络比随机生成错误更有效，性能强于 OCR 后校正和复杂拼写检查的最新神经网络。这些结果对许多数字人文项目具有实际意义。

Jul, 2023

TrOCR: 基于 Transformer 的带预训练模型的光学字符识别

本文提出了一种名为 TrOCR 的端到端文本识别方法，其中使用了预训练的图像 Transformer 和文本 Transformer 模型，不仅适用于印刷体和手写体，还适用于场景文本识别任务，并在准确率方面优于当前最先进的模型。

Sep, 2021

一种基于 Transformer 模型的端到端 OCR 框架，用于识别具有变音符的大规模古典阿拉伯文多字体语料库的手写体 Arabic 识别

本文介绍了针对阿拉伯历史文献的光学字符识别技术的研究，提出了一种端到端文本识别方法 BEIT，并通过实验比较证明，该方法优于卷积神经网络的特征提取方法，达到了 4.46% 的识别准确率。

Aug, 2022

离线手写中文文本识别与卷积神经网络

本文研究基于深度学习的方法在离线手写中文文本识别领域的应用，使用只有卷积神经网络的模型和 CTC 损失函数实现，采用 Dropout 方法以防止过拟合，最终在 ICDAR 2013 竞赛数据集上实现了 6.81% 的字符错误率，为同等条件下最好的研究结果。

Jun, 2020

基于 Transformer 的乌尔都文手写文字光学字符识别器

本文介绍了使用 Transformer 来识别复杂的乌尔都手写文本的方法。

Jun, 2022

为历史希伯来文本的 OCR 错误修正构建特定时期优化的神经网络

使用新的多阶段方法生成 OCR 错误的人工训练数据集，并进行超参数优化，以构建有效的神经网络来纠正希伯来语的 OCR 后校正。

Jul, 2023