自学习哈希用于快速相似性搜索

Apr, 2010

Self-Taught Hashing for Fast Similarity Search

Dell Zhang, Jun Wang, Deng Cai, Jinsong Lu

TL;DR该论文提出一种基于自学习的哈希方法，通过无监督学习为给定语料库中的所有文档找到 $l$ 位二进制码，再通过有监督学习训练 $l$ 个分类器，以预测之前未见过的查询文档的 $l$ 位码。在三个真实的文本数据集上的实验表明，该方法比现有技术显著地优越。

Abstract

The ability of fast similarity search at large scale is of great importance to many Information Retrieval (IR) applications. A promising way to accelerate similarity search is semantic hashing which designs compa

发现论文，激发创造

无监督神经生成语义哈希

提出了一种新的无监督生成语义哈希方法 (Ranking based Semantic Hashing,RBSH)，它由一个变分部分和一个基于排名的部分组成，能够通过哈希码生成实现文档排序，实验结果显示，相较于传统方法和最新的语义哈希方法，这种方法在不同哈希码长度下均表现得更好，使用的哈希码长度通常减少 2-4 倍。

Jun, 2019

无监督多索引语义哈希

本论文提出了一种基于多索引哈希的无监督哈希模型，使用全新的训练目标学习哈希码，提高多文档相似性搜索的效率，该模型相比于现有模型具有更高的效率，实验结果显示其效果优于现有语意哈希模型。

Mar, 2021

相似度分布学习的监督在线哈希

本研究提出一种基于相似度分布的在线哈希方法 (SDOH)，采用高斯归一化处理来解决极不平衡分布问题并通过最小化 KL 散度来对齐相似度分布，最后在三个广泛使用的基准测试中验证了该方法的优越性。

May, 2019

基于正则化相似度学习的可扩展深度哈希用于图像检索和个体重新识别

本研究提出了一种监督学习框架，直接从原始图像中生成紧凑且可扩展的哈希编码，通过使用三元组样本最大化匹配对与不匹配对在汉明空间中的边界，并同时优化图像特征和哈希函数，从而在实际应用中更具有灵活性和更高的性能。

Aug, 2015

SSDH：大规模图像检索的半监督深度哈希

本文提出一种半监督的深度哈希方法，通过同时保留语义相似性和基础数据结构来更有效地学习哈希函数。实验结果表明，该方法在 5 个常用数据集上优于现有的哈希方法。

Jul, 2016

SADIH: 语义感知离散哈希

本文提出了一种 Semantic-Aware DIscrete Hashing（SADIH）框架，旨在将转换后的语义信息直接嵌入到不对称相似度逼近和判别式哈希函数学习中，以克服监督哈希中全面保留对成对相似度的学习过程过于昂贵且无法扩展以处理大数据的问题。在多个大规模数据集上的实验结果表明，我们的 SADIH 可以明显优于最先进的基线，同时具有更低的计算成本。

Apr, 2019

ElasticHash: 使用 Elasticsearch 实现深哈希进行语义图像相似度搜索

ElasticHash 是一种适用于自然图像的高品质、高效、大规模语义相似性搜索方法，通过基于深度哈希模型学习哈希码和使用 Elasticsearch 的两段式方法实现。在查询超过 120,000 个自然图像和 OpenImages 数据集中的约 6.9 百万个数据库图像的检索性能评估中，显示了 ElasticHash 具有高质量的检索结果和低查询延迟。

May, 2023

伯努利变分自编码器和自控梯度估计的成对监督哈希

介绍了一种基于离散隐变量 VAE 的成对损失函数，通过使用无偏的低方差梯度估计器，优化网络并获得了良好的性能

May, 2020

维护语义层次的大规模图像检索深度哈希

本研究提出了一种有效的方法，以保留完整语义层次结构的类别相似性，以提高大规模图像检索的精细级别性能并生成更好的二进制代码。

Jan, 2019

无监督语义哈希与对偶重构

本文介绍了使用 Pairwise Reconstruction 的语义哈希方法，将弱监督的训练对编码为哈希码，并通过对这些哈希码的成对重构来实现对局部邻域结构的编码，从而在文档相似度搜索任务中获得了重要的性能改进。

Jul, 2020