Jul, 2023

优化神经网络训练以用于历史希伯来文本的 OCR 错误修正

TL;DR本研究通过创新方法训练一种轻量级神经网络,用于希伯来语 OCR 后处理,使用少量手动创建的数据。通过实验发现,使用所提出方法训练的网络比随机生成错误更有效,性能强于 OCR 后校正和复杂拼写检查的最新神经网络。这些结果对许多数字人文项目具有实际意义。