本文探讨在搜索场景下使用b位最小哈希法(“minwise hashing”)需要解决的问题,并提出了并行化方案、基于简单哈希函数的b位最小哈希实现方法等,验证了该方法在数据大小和训练效果上的优势。
May, 2012
提出了一种名为密度敏感哈希(DSH)算法,它是局部敏感哈希(LSH)的扩展,利用数据的几何结构避免了纯随机投影的限制,并在大规模高维数据搜索中取得更好的性能。
使用紧凑的二进制编码表示图像数据和特征描述符的研究表明,多个哈希表可用于在 Hamming 空间中进行精确的 k 近邻搜索,并且在 64、128 或 256 位的十亿级数据集上,其运行时间呈子线性表现,从而实现了极大的速度提升。
Jul, 2013
本研究提出使用 feed-forward 神经网络来实现稀疏高维哈希码,并且通过对视觉和多模态数据的实验评估表明该方法具有显著的优势。
Dec, 2013
本文介绍了哈希方法作为解决最近邻搜索问题的一种主要方法的概述,其中对基于数据分布设计哈希函数和基于数据学习设计哈希函数的两种主要哈希算法进行了阐述和综述。
Aug, 2014
本研究综述了基于哈希技术的ANN搜索的发展历程和应用,重点介绍了基于数据驱动学习方法和深度学习模型的哈希应用技术,分析了优缺点,并探讨了未来的研究趋势。
Sep, 2015
提出一种新的无需数据空间分割的随机化算法来避免由于数据维度过高而导致的数据检索问题,并通过理论分析和实验结果来证明这种算法在数据近似性、速度和空间效率等方面优于传统的局部敏感哈希算法(LSH)
Dec, 2015
本研究提出了一种互信息学习的哈希方法MIHash,可以在在线和批处理设置中使用,有效地减少哈希表重新计算并学习具有高质量的哈希函数,在2.5M图像数据集上取得了良好的表现。
Mar, 2017
通过随机抽样和随机投影的组合,FastLSH算法将LSH计算的时间复杂度从O(n)降低到O(m)(其中m < n),并具有可证明的LSH属性,是一种有希望替代经典LSH方案的方法。
Sep, 2023
提供了一种基于 CP 和 tensor train (TT) 分解技术的 LSH 方法,适用于欧几里得距离和余弦相似度的张量数据,具有空间高效性。
Feb, 2024