Mar, 2023

针对资源匮乏语言和字母的词典来源的可扩展手写文本识别系统

TL;DR本文介绍了一种解读大量手写历史词典索引卡的方法,使用一种特别设计的手写文本识别解决方案,包括优化的检测模型,SPN、RCNN 和 CTC 三种卷积神经网络结构,以及基于约束的单词匹配算法。该方法在波兰 17th-18th 世纪历史词典的 2.8 万个索引卡上取得了 0.881 的准确率,为将来的 HTR 应用提供了可行的思路。