IJCAIJul, 2023

基于显式位置增强的鲁棒场景文本图像超分辨率

TL;DR本研究提出了一种名称为 LEMMA 的新方法,通过显式建模字符区域,生成具有高级文本特定引导的超分辨率图像,通过位置增强模块和多模态对齐模块提升字符区域的特征提取和视觉 - 语义对齐,并使用自适应融合模块将先验引导无缝融合到超分辨率分支中。在 TextZoom 和四个场景文本识别基准测试上的实验证明了本方法相对于其他最先进技术的优越性。