IJCAIMay, 2024
基于对称重叠建模的自监督预训练在场景文本识别中的应用
Self-Supervised Pre-training with Symmetric Superimposition Modeling for Scene Text Recognition
Zuan Gao, Yuxin Wang, Yadong Qu, Boqiang Zhang, Zixiao Wang...
TL;DR通过 Symmetric Superimposition Modeling (SSM) 方法,该研究致力于同步捕捉文本图像中的字符特征和语言信息,并在各种文本识别基准测试中展示了其有效性和广泛性,以平均 4.1% 的性能提升和 86.6% 的新的 Union14M 基准平均字词准确性成果。