Aug, 2023

关键词检测简化:采用字符计数和 CTC 重新评分的无分割方法

TL;DR最近的无分割关键词检测的研究寻求在对象检测范式中解决这一问题,并借鉴最先进的检测系统,同时提出了一个词边界框提议机制和计算相应表示。与依赖复杂和庞大的深度神经网络模型的方法相反,我们提出了一种新颖的无分割系统,通过自动学习的比例图在文档图像上高效地扫描以找到包含查询信息的矩形区域。该底层模型简单而紧凑,通过对字级别注释图像进行训练,预测矩形区域上的字符出现。通过积分图和二分搜索以经济高效的方式执行所提出的文档扫描。最后,通过金字塔表示和基于 CTC 的重新评分算法来完善字符计数的检索相似性,充分利用训练好的卷积神经网络模型。对两个广泛使用的数据集进行的实验证实表明,尽管底层模型简单,我们的方法实现了最先进的结果,超过了更复杂的替代方案。