Jan, 2024

通过阅读顺序估计和动态采样实现类似逆操作的场景文本定位

TL;DR提出了一种统一的端到端可训练的反向场景文本检测框架,通过创新的阅读顺序估计模块 (REM)、轻量级边界精化模块 (BRM) 和动态采样模块 (DSM) 实现了对复杂布局的反向场景文本的有效识别。