Oct, 2019

MASTER: 场景文字识别的多方位非局部网络

TL;DR提出了一种基于自注意力的场景文本识别器 ——MASTER。相比于基于 RNN 的编码器 - 解码器体系结构,该模型通过学习 1d 或 2d 注意力来利用更紧凑的中间表示,在编码器和解码器内部学习自我注意力,从而解决了关注漂移和低效率的问题。