CVPRApr, 2021

通过联合文本检测和相似性学习实现场景文本检索

TL;DR本篇论文提出了一种新的场景文本检索方法,使用交叉模态相似性学习直接匹配查询文本和自然图像中每个文本实例之间的相似性,并通过建立端到端可训练的网络来实现场景文本检测和交叉模态相似性学习的联合优化,在三个基准数据集上的实验表明该方法优于现有的场景文本检测 / 检索方法,尤其是联合检测和相似性学习的框架比分离方法性能更好。