May, 2019

卷积神经网络中的文本映射集成,用于不同文本类别的区域检测

TL;DR提出了一种新技术,将外观和文本结合在卷积神经网络(CNN)中,以便检测不同文本类别的区域。该技术通过一种名为text-map的新的文本语义视觉表示与实际图像相集成,针对商品编码的文本类别如配料或营养成分的多种类型的标识具有优异性能,采用OCR识别技术为预处理。针对Nielsen Brandbank的自有数据集,实验结果表明,该方法优于仅基于外观的标准Faster R-CNN等最先进的算法,精确率和召回率均得到了显著提高。