ECCVNov, 2022

集成专家的纯 Transformer 用于场景文本识别

TL;DR本文提出了使用 tranformer-only 模型作为识别场景文字的基线,并且利用 Pure Transformer with Integrated Experts 优化了解码过程,实现了对多尺度图片的处理和原始字符顺序的识别,并在七个基准测试中超越了 20 个最先进的方法,达到了最先进的效果。