基于层级结构的图像嵌入方法用于语义图像检索

Sep, 2018

基于层级结构的图像嵌入方法用于语义图像检索

Hierarchy-based Image Embeddings for Semantic Image Retrieval

Björn Barz, Joachim Denzler

TL;DR该研究提出了通过将图像映射到类别嵌入中以学习语义鉴别性特征的方法，从而提高图像检索结果的语义一致性。结果显示在 CIFAR-100，NABirds 和 ImageNet 上，学习到的图像嵌入大大提高了图像检索结果的语义一致性。

Abstract

deep neural networks trained for classification have been found to learn powerful image representations, which are also often used for other tasks such as comparing images w.r.t. their →

deep neural networks image representations visual similarity semantic similarity class embeddings

发现论文，激发创造

基于层次结构的视觉和语义相似度融合图像检索

提出了一种基于内容的图像检索方法，通过构建视觉层次结构来捕捉视觉和语义的相似性，将其融合到相似度搜索的距离计算度量中，实验证明该方法在图像检索方面具有优越性能。

Aug, 2023

使用蕴涵锥嵌入的分层图像分类

该论文提出了一套使用嵌入到分类标签中的类层次结构信息，通过改进算法进行图像分类和表示学习的方法，并将其在 ETHEC 数据集中进行了实证测试。

Apr, 2020

LEWIS: 单词图像的潜在嵌入及其语义

本文提出一种使用卷积神经网络和加权排名损失函数的方法，从单词图像中直接预测语义概念，实现文本识别和检索中的语义关联，实验证明该方法的正确性和高度准确性。

Sep, 2015

维护语义层次的大规模图像检索深度哈希

本研究提出了一种有效的方法，以保留完整语义层次结构的类别相似性，以提高大规模图像检索的精细级别性能并生成更好的二进制代码。

Jan, 2019

基于语义类别的图像检索的可扩展非线性嵌入

提出了一种新颖的算法，用于通过非线性嵌入向量到低维欧氏空间中进行监督判别距离学习，该方法可以被视为核神经网络，并且可以通过类似于线性 Mahalanobis 距离度量学习算法的近似核化得出，该方法的模型参数数量和测试时间评估复杂度均为 O (dD)，其中 D 是输入特征的维度，d 是投影空间的维数，在具有数十万个训练对的 CNN 特征的数据集上进行了实证比较。

Sep, 2015

在汉堡中查找豆子：利用深度语义视觉嵌入实现定位

本研究提出了一种新的两条路径的神经网络，其中视觉路径采用了最新的空间感知池化机制模型，结合从头开始训练的文本路径，实现了一种多模态嵌入。在处理带有标注图像的任务中经过训练后，该模型可提供新的跨模态检索性能和短语的视觉定位，达到了最新的最佳表现。

Apr, 2018

条件相似网络

本篇论文提出了一种称为 “条件相似性网络” 的方法，用于学习分离式嵌入，不同的相似性概念被编码在不同的语义子空间，并用于解决多个不同相似性概念的问题。

Mar, 2016

学习密集卷积嵌入用于语义分割

本文提出了基于像素 embeddings 的深层卷积神经网络，利用嵌入学习像素之间的距离来推断像素是否属于同一区域，并证明其与 DCNN 结合使用可以显著提高每个像素分类的准确性。

Nov, 2015

词汇语义增强的神经词向量

通过深度度量学习进行后处理可以提高神经语言模型中语义相似度推断的效果，并将层次拟合用于建模 IS-A 层次中的语义相似性细微差别。

Oct, 2022

学习鲁棒的视觉 - 语义嵌入

该研究提出了一种基于无监督学习和深度神经网络的终端到终端学习框架，结合自编码器和最大均值差异损失来学习语义和视觉特征的联合嵌入，实现了跨域多模态表示的提取，并构建了更全面的标记和未标记数据的嵌入，帮助从归纳到传导的范围内解决零样本和少样本图像识别和检索等各种复杂任务。

Mar, 2017