Jul, 2018

一种高效的端到端神经模型用于手写文本识别

TL;DR本文提出一种将卷积神经网络和序列到序列模型相结合,将图像映射到文本序列,实现手写文本识别能力,且采用Focal Loss方法解决文本识别的类别不平衡问题,并应用Beam Search算法来提升模型的解码性能,在常见的IAM和RIMES数据集上实验表明,本文提出的模型在词级别的准确率方面分别提高了3.5%和1.1%,达到了国际先进水平。