无监督多索引语义哈希
本研究综述了基于哈希技术的ANN搜索的发展历程和应用,重点介绍了基于数据驱动学习方法和深度学习模型的哈希应用技术,分析了优缺点,并探讨了未来的研究趋势。
Sep, 2015
本研究提出了一种互信息学习的哈希方法MIHash,可以在在线和批处理设置中使用,有效地减少哈希表重新计算并学习具有高质量的哈希函数,在2.5M图像数据集上取得了良好的表现。
Mar, 2017
本文提出了一种名为无监督语义深度哈希(USDH)的新型无监督深度哈希方法,使用卷积神经网络学习特征和哈希码,并利用CNN特征层中保留的语义信息来指导网络训练。在CIFAR-10,NUSWIDE和Oxford 17数据集上进行了广泛实验,结果表明USDH相较于其他无监督哈希方法更加有效。
Mar, 2018
本文提出了一种Semantic-Aware DIscrete Hashing(SADIH)框架,旨在将转换后的语义信息直接嵌入到不对称相似度逼近和判别式哈希函数学习中,以克服监督哈希中全面保留对成对相似度的学习过程过于昂贵且无法扩展以处理大数据的问题。在多个大规模数据集上的实验结果表明,我们的SADIH可以明显优于最先进的基线,同时具有更低的计算成本。
Apr, 2019
提出了一种新颖的深度无监督哈希模型 DistillHash,在信任相似信号的数据对中进行蒸馏,并采用贝叶斯学习框架从蒸馏的数据集中学习哈希函数,实验结果显示 DistillHash 达到了最先进的搜索性能。
May, 2019
提出了一种新的无监督生成语义哈希方法(Ranking based Semantic Hashing,RBSH),它由一个变分部分和一个基于排名的部分组成,能够通过哈希码生成实现文档排序,实验结果显示,相较于传统方法和最新的语义哈希方法,这种方法在不同哈希码长度下均表现得更好,使用的哈希码长度通常减少2-4倍。
Jun, 2019
本文介绍了使用Pairwise Reconstruction的语义哈希方法,将弱监督的训练对编码为哈希码,并通过对这些哈希码的成对重构来实现对局部邻域结构的编码,从而在文档相似度搜索任务中获得了重要的性能改进。
Jul, 2020
本文提出了一种名为CIMON的新方法,通过全局细化和相似性统计分布获得可靠且平滑的指导,并引入语义和对比一致性学习来推导既具有扰动不变性又具有区分性的哈希码,通过在多个基准数据集上进行的大量实验证明,该提出的方法在检索性能和鲁棒性方面均优于一系列现有技术方法。
Oct, 2020
ElasticHash是一种适用于自然图像的高品质、高效、大规模语义相似性搜索方法,通过基于深度哈希模型学习哈希码和使用Elasticsearch的两段式方法实现。在查询超过120,000个自然图像和OpenImages数据集中的约6.9百万个数据库图像的检索性能评估中,显示了ElasticHash具有高质量的检索结果和低查询延迟。
May, 2023