MMJul, 2022

手写汉字文本分割识别:一种无需分段注释的方法

TL;DR提出一种基于分割的方法以识别手写中文文本,使用简单而有效的完全卷积网络实现。使用一种新颖的弱监督学习方法,只需使用交录注释即可训练网络;无需先前分割方法所需的昂贵字符分割标注。因为完全卷积网络缺乏上下文建模,所以提出了一种上下文规则化方法将上下文信息纳入训练,进一步提高了识别性能。在四个广泛使用的基准测试上进行了广泛实验,即 CASIA-HWDB,CASIA-OLHWDB,ICDAR2013 和 SCUT-HCCDoc,结果表明我们的方法在在线和离线 HCTR 上都显著优于现有方法,并且比 CTC / 基于注意力的方法具有更高的推断速度。