ocr post-correction | BriefGPT

关键词ocr post-correction

搜索结果 - 4

为历史希伯来文本的 OCR 错误修正构建特定时期优化的神经网络
使用新的多阶段方法生成 OCR 错误的人工训练数据集，并进行超参数优化，以构建有效的神经网络来纠正希伯来语的 OCR 后校正。
PDFa year ago
优化神经网络训练以用于历史希伯来文本的 OCR 错误修正
本研究通过创新方法训练一种轻量级神经网络，用于希伯来语 OCR 后处理，使用少量手动创建的数据。通过实验发现，使用所提出方法训练的网络比随机生成错误更有效，性能强于 OCR 后校正和复杂拼写检查的最新神经网络。这些结果对许多数字人文项目具有
PDFa year ago
EMNLP针对濒危语言文本的 OCR 后校正
针对极度濒危语言中大多数没有用于构建自然语言处理模型的数据的情况，本文提出了一种从不可读的文本数据中提取文本的方法，具体而言，在三种极度濒危的语言中创建了一个基准数据集，并针对数据不足的 OCR 研究有效性做了系统分析，开发了一种针对数据不
PDF4 years ago
COLING将传统序列到序列模型与编码器 - 解码器神经网络在单调字符串翻译任务上进行比较
本文研究了使用编码 - 解码神经模型在 OCR 校正、拼写校正、音素转换和词形还原等方面的表现，以及与其他传统方法和更专业的模型进行了比较。
PDF8 years ago