- CVPRAMC:基于注意力的多模态相关学习用于图像搜索
本文提出了一种基于注意力机制的多模式关联(AMC)学习方法,该方法可以使图像检索受益于可用的丰富模式信息,进而提高检索结果的排序准确性。
- CVPR上下文视觉相似性
本文提出了概念 “上下文视觉相似度”,并探讨了在图像搜索应用领域的应用。使用三张图片,通过学习各个图像各个维度的特征权重以及重加权后的距离来确定查询图片与正向图片的相似度,以及他们与负向图片的相异度。
- 比赛核函数中的干扰
提出了两种方法来解决局部特征点干扰问题,即通过在聚合阶段包含一组描述符权重来平等地处理每个本地描述符的个体贡献,并在标准公共图像检索基准测试中进行实验证明对于短向量或中向量的图像搜索,这两种方法都比对象方法表现更好。
- NIPS利用大规模网络标注图像进行多模态词嵌入的训练和评估
本研究旨在使用文本和视觉信息进行有效的单词嵌入训练和评估。研究人员提出了一个大规模数据集,其中包含 300 万语句,描述了来自 Pinterest 的超过 4000 万张图像。该研究还报道了一种基于 RNN 的多模态模型,通过在嵌入中整合视 - SIGIR将文本描述转化为高层视觉表征
本文介绍了一种利用神经网络模型 Text2Vis 在视觉特征空间中实现基于短文本描述信息的图像搜索方法,并通过针对文本和视觉损失函数的优化来提高搜索效率和精确度,并在 MS-COCO 数据集上进行了初步结果呈现。
- 基于卷积神经网络和 Radon 变换的快速医学图像检索生成二进制标签
本研究提出了一种采用卷积神经网络和 Radon 条形码的医学图像检索方法,结果表明其在医疗图像中检索方面的表现优于其他已发表的方法。
- CNN 特征转移的良好实践
本研究旨在有效转移卷积神经网络(CNN)在图像搜索和分类中的特征。通过系统研究 CNN 转移的三个要点,本研究得出了使用适当大小的图像作为 CNN 输入的优势,使用平均 / 最大池化改善特征映射的不同 CNN 层的性能的结果以及在不同 CN - ECCV聚合深度卷积特征的跨维度加权
通过交叉维度加权和聚合深度卷积神经网络层的输出,提出了一种简单而直接的创建强大图像表示的方法。实验表明,在图像搜索中,该方法优于基于预训练网络的当前最先进的方法,并提供了易于使用的开源实现来重现结果。
- 使用 CNN 激活的积分最大池化进行特定对象检索
本文尝试使用基于 CNN 的图像表示来重新设计目标检索流程,首次在 Oxford5k 和 Paris6k 数据集上效果能够与传统方法一较高下。
- 通过深度卷积神经网络监督学习保持语义的哈希
本文提出了一种简单而有效的有监督深度哈希方法,构建了来自标记数据的二进制哈希代码,用于大规模图像搜索,在此基础上,哈希函数作为深度网络中的一个潜在层得到构建,最小化分类错误和其他理想哈希代码属性上的目标函数,以实现联合学习的图像表示,哈希代 - WhittleSearch:基于相对属性反馈的交互式图片搜索
该论文提出了一种新颖的图像搜索反馈模式,其中用户可以描述应调整示例图像的哪些属性以更贴近其所寻找的图像的心理模型,并利用比较语言以多维属性空间中的约束迭代更新其相关性函数和重新排列图像数据库,通过使用相对属性的顺序特性,以提高搜索速度和准确 - 人物再识别遇到图像搜索
本文将人员再识别作为图像搜索问题,并通过设计一种无监督的词袋表示法,将图像搜索技术整合到人员再识别中。同时,贡献了一个新的高质量数据集,在三个数据集上得到了与最先进方法相当的竞争结果。
- 具有嵌入的方位协变局部描述符聚合
本文提出了一种基于角度的局部描述符集成方法,通过将角度一同编码到集成阶段并结合单项式嵌入来实现对局部描述符的聚合。此方法不需要码本,并且适用于多种编码方法。在 Holidays 和 Oxford buildings 数据集上的实验证明其对于 - 图像风格识别
本研究探讨了计算机视觉中图像风格对于图像感知的影响,通过使用多层网络训练得出最佳效果的图像特征进行分类,并成功将这些分类器扩展到 tag-based image search 中,以提高搜索的效果。