ECCVJul, 2022

通过强化学习调整注释边界框,提高端到端场景文本识别的最优性

TL;DR本文提出了一种名为 Box Adjuster 的基于强化学习的方法,用于调整每个文本边界框的形状以使其更与文本识别模型兼容。此外,当处理跨域问题时,该方法显著减少源域和目标域之间的分布不匹配。实验证明,使用调整后的边界框作为训练的基础可以提高端到端文本识别系统的性能。在多个场景文本理解基准数据集上,该方法的端到端文本识别任务的 F-Score 平均提高了 2.0%,域适应任务的 F-Score 平均提高了 4.6%,表现优于现有技术。