提出一种基于局部敏感过滤的随机选择算法 LSF-Join,可以高效地在大数据集上以近似的方式查找所有匹配对,特别适用于高维数据集,解决了以往算法在大规模数据上无法适用的问题。
Mar, 2020
该研究论文介绍了时空权衡的上下界,并提出了第一种子线性查询时间和近似线性空间数据结构,可用于每个逼近因子 c>1 的近邻搜索问题,并通过建立一些类推到当地可解码代码的联系来表明两种探针的无条件单元格探针下限。
Aug, 2016
本文提出了基于熵局部敏感哈希的分布式分层哈希方案,能够显著减少网络流量,提高实际应用程序的运行效率。
Oct, 2012
本文提出了一种新的局部敏感哈希函数的结构,覆盖了海明空间中给定半径内的每对向量,其效率接近于最佳数据独立 LSH,适用于在海明空间中进行相似性搜索。
Jul, 2015
提出了一个新的数据结构用于解决欧几里得空间中近似最近邻问题,其查询时间和空间复杂度分别为 O (n^ρ + dlogn) 和 O (n^(1+ρ)+dlogn),这是对先前算法性能的改进,同时也是第一个突破已有局部敏感哈希下界的数据结构。并可通过标准归约获取解决海明空间和 l1 范数的数据结构。
Jun, 2013
研究了关于敏感哈希族的一些性质,证明了在 $L_1$ 度量空间中,不可能构造出一个性能与 Indyk 和 Motwani 相同的敏感哈希族。
Oct, 2005
提供了一种基于 CP 和 tensor train (TT) 分解技术的 LSH 方法,适用于欧几里得距离和余弦相似度的张量数据,具有空间高效性。
Feb, 2024
本文提出了一种基于数据的哈希方案,用于解决近似最近邻问题,对于 $n$ 个 $d$ 维数据集,我们的数据结构实现了查询时间 $O (d n^{ ho+o (1)})$ 和空间复杂度 $O (n^{1+ ho+o (1)}+dn)$,其中 $ ho= frac {1}{2c^2-1}$,而在 Hamming 空间中,我们获得了指数 $ ho= frac {1}{2c-1}$。此外,我们的结果比所有逼近因子 $c>1$ 的最佳 LSH 数据结构 [IM98, AI06] 更优。
Jan, 2015
本研究提出一种新的框架用于构建空间划分,将问题转化为平衡图划分和监督分类,并结合 KaHIP 图分区器和神经网络,实现了一种新的分区过程称为神经局部敏感哈希(Neural LSH),实验证明 Neural LSH 的分区在标准最近邻搜索(NNS)基准测试中,始终优于基于量化和树的方法,以及经典的数据无关 LSH。
Jan, 2019
本研究介绍了一种显式嵌入方法,将流形搜索转化为欧氏距离搜索,并且利用近似傅里叶基础加速在线搜索,从而提高了特定对象的检索精度和效率。
Mar, 2017