Sep, 2018
基于层级结构的图像嵌入方法用于语义图像检索
Hierarchy-based Image Embeddings for Semantic Image Retrieval
Björn Barz, Joachim Denzler
TL;DR该研究提出了通过将图像映射到类别嵌入中以学习语义鉴别性特征的方法,从而提高图像检索结果的语义一致性。结果显示在 CIFAR-100,NABirds 和 ImageNet 上,学习到的图像嵌入大大提高了图像检索结果的语义一致性。
Abstract
deep neural networks trained for classification have been found to learn
powerful image representations, which are also often used for other tasks such
as comparing images w.r.t. their →
发现论文,激发创造
基于层次结构的视觉和语义相似度融合图像检索
提出了一种基于内容的图像检索方法,通过构建视觉层次结构来捕捉视觉和语义的相似性,将其融合到相似度搜索的距离计算度量中,实验证明该方法在图像检索方面具有优越性能。
Aug, 2023
LEWIS: 单词图像的潜在嵌入及其语义
本文提出一种使用卷积神经网络和加权排名损失函数的方法,从单词图像中直接预测语义概念,实现文本识别和检索中的语义关联,实验证明该方法的正确性和高度准确性。
Sep, 2015
基于语义类别的图像检索的可扩展非线性嵌入
提出了一种新颖的算法,用于通过非线性嵌入向量到低维欧氏空间中进行监督判别距离学习,该方法可以被视为核神经网络,并且可以通过类似于线性 Mahalanobis 距离度量学习算法的近似核化得出,该方法的模型参数数量和测试时间评估复杂度均为 O (dD),其中 D 是输入特征的维度,d 是投影空间的维数,在具有数十万个训练对的 CNN 特征的数据集上进行了实证比较。
Sep, 2015
在汉堡中查找豆子:利用深度语义视觉嵌入实现定位
本研究提出了一种新的两条路径的神经网络,其中视觉路径采用了最新的空间感知池化机制模型,结合从头开始训练的文本路径,实现了一种多模态嵌入。在处理带有标注图像的任务中经过训练后,该模型可提供新的跨模态检索性能和短语的视觉定位,达到了最新的最佳表现。
Apr, 2018
学习密集卷积嵌入用于语义分割
本文提出了基于像素 embeddings 的深层卷积神经网络,利用嵌入学习像素之间的距离来推断像素是否属于同一区域,并证明其与 DCNN 结合使用可以显著提高每个像素分类的准确性。
Nov, 2015
学习鲁棒的视觉 - 语义嵌入
该研究提出了一种基于无监督学习和深度神经网络的终端到终端学习框架,结合自编码器和最大均值差异损失来学习语义和视觉特征的联合嵌入,实现了跨域多模态表示的提取,并构建了更全面的标记和未标记数据的嵌入,帮助从归纳到传导的范围内解决零样本和少样本图像识别和检索等各种复杂任务。
Mar, 2017