ECCVSep, 2022
为 OOV-STR 设计的视觉语言自适应互补解码器
Vision-Language Adaptive Mutual Decoder for OOV-STR
Jinshui Hu, Chenyu Liu, Qiandong Yan, Xuyang Zhu, Fengli yu...
TL;DR该研究提出了一种名为 VLAMD 的框架,该框架基于深度学习,利用语言先验知识,设计了一种针对 OCR 中存在的 Out-of-vocabulary 问题的解决方案,其中包括注意力 LSTM 解码器,自回归转换器解码器和双向训练方法,该方法在 2022 ECCV TiE Workshop 的 OOV-ST 挑战中表现出良好的性能。