ECCVMar, 2016

基于 CNN 的空间金字塔 VLAD 编码的稠密图像表示与本地鲁棒性字幕生成

TL;DR本文提出了一种使用局部聚合描述符(VLAD)将空间金字塔 CNN 特征编码的方法,以更准确地反映图像的局部信息。结果表明,使用 VLAD 编码可以仅使用 3%的维度匹配 CNN 特征,并与空间金字塔结合使用可以更准确地将局部元素考虑在内。