Sep, 2019

基于部分监督学习的大规模中文街景文字阅读

TL;DR该研究提出了一个大规模的文本阅读基准数据集,名为Chinese Street View Text(C-SVT),可用于评估深度学习模型的性能。同时,介绍了使用弱标注数据的部分监督学习框架进行文本识别的方法。基于该框架,提出了一种在线提议匹配模块和一种共享参数的定位算法,以提高模型的端到端识别表现,并在ICDAR 2017-RCTW数据集中取得了最新的结果。