Oct, 2019

KuroNet:基于深度学习的日本古书草字体识别

TL;DR本研究提出了使用一种新的端到端模型KuroNet来识别日文草书体,并转录为现代日本字符。通过预测整个文本页中所有字符的位置和标识,该模型可以处理长距离上下文、大词汇量和非标准化字符布局。我们证明了该系统能够成功识别大部分旧式日本文献,同时也探讨了系统局限性,并提出了未来工作的方向。