ECCVSep, 2022

为 OOV-STR 设计的视觉语言自适应互补解码器

TL;DR该研究提出了一种名为 VLAMD 的框架,该框架基于深度学习,利用语言先验知识,设计了一种针对 OCR 中存在的 Out-of-vocabulary 问题的解决方案,其中包括注意力 LSTM 解码器,自回归转换器解码器和双向训练方法,该方法在 2022 ECCV TiE Workshop 的 OOV-ST 挑战中表现出良好的性能。