Feb, 2024

高效利用语言先验进行场景文本定位

TL;DR通过利用大型文本语料库中的语言知识,替换自回归场景文本定位和识别模型中传统的独热编码,提高了场景文本定位和识别性能,并实现了更准确的词语定位。