May, 2022

基于 CTC 模型的印度语言 OCR 的实证研究

TL;DR该论文研究了用 CTC 建立神经网络模型的方法,将 13 种印度语言的文字识别单位定为行或单词,使用合成数据训练模型,对比公共 OCR 工具,提出了新的公共数据集 Mozhi,实现了在印度语言中进行单词和行识别的 OCR。