CVPRApr, 2024

在端到端和两步法文本定位之间建立桥梁

TL;DR通过引入 Bridging Text Spotting 方法,本文解决了两步方法中存在的错误累积和次优性能问题,同时保留了模块化特性。通过将训练良好的检测器和识别器锁定参数,并通过初始化权重为零的神经网络连接它们,确保了检测中的大感受野特征自然地融入锁定的识别器中。此外,为了有效学习端到端优化特性,采用了 Adapter。通过广泛的实验证明了该方法的有效性。