IJCAIMay, 2024

基于对称重叠建模的自监督预训练在场景文本识别中的应用

TL;DR通过 Symmetric Superimposition Modeling (SSM) 方法,该研究致力于同步捕捉文本图像中的字符特征和语言信息,并在各种文本识别基准测试中展示了其有效性和广泛性,以平均 4.1% 的性能提升和 86.6% 的新的 Union14M 基准平均字词准确性成果。