AAAIApr, 2021

PGNet:基于点集聚合的任意形状实时文本检测网络

TL;DR本文提出了全卷积的点聚集网络(PGNet)用于实时读取任意形状的文字,并且在减少 NMS 和 RoI 操作的同时,通过提出的 PG-CTC 损失对像素级别的字符分类图进行学习,避免使用字符级别注释。同时,通过建立字符与其相邻字符之间的联系,引入图形优化模块(GRM)以优化粗糙的识别并提高端到端性能。实验结果证明了所提出的方法具有竞争性的准确性,同时显著提高了运行速度。