Oct, 2019

使用2D自注意力网络识别任意形状的文本

TL;DR这篇论文提出了一种名为 SATRN 的新型体系结构,受 Transformer 启发,利用自注意机制描述场景文本图像中字符的二维空间依赖性,能够识别任意形状的文本,效果可以打败现有的STR模型,尤其是在“不规则文本”基准测试中表现得非常出色。