Jan, 2020
结合视觉和局部池化文本特征的细粒度图像分类和检索
Fine-grained Image Classification and Retrieval by Combining Visual and Locally Pooled Textual Features
Andres Mafla, Sounak Dey, Ali Furkan Biten, Lluis Gomez, Dimosthenis Karatzas
TL;DR本文提供了一种新颖的模型,使用 PHOC 描述符构建一组文本词袋以及 Fisher 向量编码,以处理文本与视觉数据之间的内在关系,从而在图像细分类和图像检索任务中获得最先进的结果。