Apr, 2016

使用字符纠错和基于特征的单词分类来进行 OCR 错误纠正

TL;DR该论文探讨了使用学习分类器进行后期 OCR 文本纠错的方法。阿拉伯语实验表明,这种方法结合加权混淆矩阵和浅层语言模型,可以改进我们数据集上绝大多数的分割和识别错误,这是最常见的类型。