Jan, 2024

SwinTextSpotter v2:场景文字识别的协同优化

TL;DRSwinTextSpotter v2 是一个新的端到端场景文字识别框架,通过引入 Recognition Conversion 和 Recognition Alignment 模块来加强文本检测和识别之间的关系,从而在各种多语言基准测试中取得了最先进的性能。