Nov, 2021

CDistNet: 感知多域字符距离以增强文本识别鲁棒性

TL;DR本文提出了一种名为 MDCDP 的模块,通过引入注意机制,利用位置编码查询视觉和语义特征,融合两种受约束特征以产生加强的特征,生成良好的内容感知嵌入,能够很好地感知字符之间的间距变化和语义亲和力。通过将多个 MDCDP 堆叠以引导逐渐准确的距离建模,成功构建了特征 - 字符对齐,解决了在文本识别中出现的各种困难问题。我们在两个增强数据集和六个公共基准上进行了实验,结果表明 CDistNet 在具有挑战性的识别场景中大幅优于最近的热门方法,也在标准基准上取得了最新的准确性。此外,可视化结果表明 CDistNet 在视觉和语义领域都实现了合适的信息利用。