Dec, 2023

构建合成与真实世界的预训练场景文本检测器

TL;DR借助综合利用大规模有注释的合成数据(LSD)和未标记真实数据(URD)的 FreeReal 预训练范式,通过一种新颖的基于字符结构的混合机制(GlyphMix)以及在各种语言环境下有效地修补英语主导 LSD 到 URD 所引起的语言域差异,FreeReal 在改进 DBNet、PANet、PSENet 和 FCENet 等方法的性能上持续表现出色,相对于以前的预训练方法平均有 4.56%、3.85%、3.90%和 1.97%的显著增益。