ECCVNov, 2021
多模态文本识别网络:视觉和语义特征之间的交互增强
Multi-modal Text Recognition Networks: Interactive Enhancements between Visual and Semantic Features
Byeonghu Na, Yoonsik Kim, Sungrae Park
TL;DR本篇论文介绍了一种名为 MATRN(Multi-modAl Text Recognition Network)的新方法,通过促进视觉和语义特征之间的互动,提高了文字识别的性能,并证明其在 7 项基准测试上取得了最先进的表现。