Jan, 2020

结合视觉和局部池化文本特征的细粒度图像分类和检索

TL;DR本文提供了一种新颖的模型,使用 PHOC 描述符构建一组文本词袋以及 Fisher 向量编码,以处理文本与视觉数据之间的内在关系,从而在图像细分类和图像检索任务中获得最先进的结果。