Aug, 2023

SRFormer:基于回归的文本检测 Transformer 与分割技术的协同增强

TL;DR我们提出了一种基于 SRFormer 的统一模型,融合了分割和回归,旨在实现分割表示的鲁棒性和实例级回归的直接后处理。通过在初始解码器层获取有利的分割预测结果,我们限制了分割分支的融入,并在后续层中采用渐进式回归优化,实现了性能的提升,同时最小化了掩膜带来的额外计算负载。此外,我们提出了一个基于掩膜信息的查询增强模块,利用分割结果作为自然软区域感兴趣池化和提取鲁棒的像素表示,进而增强和多样化实例查询。在多个基准测试中进行了广泛实验,得出了有说服力的结果,突显了我们的方法在鲁棒性、训练和数据效率以及性能方面的卓越表现。