使用局部敏感过滤的时空权衡相似性搜索框架

May, 2016

使用局部敏感过滤的时空权衡相似性搜索框架

A Framework for Similarity Search with Space-Time Tradeoffs using Locality-Sensitive Filtering

Tobias Christiani

TL;DR提出一种基于局部敏感过滤的相似性搜索框架，扩展了 Indyk-Motwani (STOC 1998) 的局部敏感哈希 (LSH) 框架以支持时空权衡。

Abstract

We present a framework for similarity search based on Locality-Sensitive Filtering (LSF), generalizing the Indyk-Motwani (STOC 1998) Locality-Sensitive Hashing (LSH) framework to support space-time tradeoffs. Giv

发现论文，激发创造

LSF-Join: 基于局部敏感过滤的偏斜分布下分布式全对集合相似性算法

提出一种基于局部敏感过滤的随机选择算法 LSF-Join，可以高效地在大数据集上以近似的方式查找所有匹配对，特别适用于高维数据集，解决了以往算法在大规模数据上无法适用的问题。

Mar, 2020

基于哈希的近似最近邻时间空间权衡的最优解

该研究论文介绍了时空权衡的上下界，并提出了第一种子线性查询时间和近似线性空间数据结构，可用于每个逼近因子 c>1 的近邻搜索问题，并通过建立一些类推到当地可解码代码的联系来表明两种探针的无条件单元格探针下限。

Aug, 2016

高效的分布式局部敏感哈希

本文提出了基于熵局部敏感哈希的分布式分层哈希方案，能够显著减少网络流量，提高实际应用程序的运行效率。

Oct, 2012

无误差局部敏感哈希: CoveringLSH

本文提出了一种新的局部敏感哈希函数的结构，覆盖了海明空间中给定半径内的每对向量，其效率接近于最佳数据独立 LSH，适用于在海明空间中进行相似性搜索。

Jul, 2015

超越局部敏感哈希

提出了一个新的数据结构用于解决欧几里得空间中近似最近邻问题，其查询时间和空间复杂度分别为 O (n^ρ + dlogn) 和 O (n^(1+ρ)+dlogn)，这是对先前算法性能的改进，同时也是第一个突破已有局部敏感哈希下界的数据结构。并可通过标准归约获取解决海明空间和 l1 范数的数据结构。

Jun, 2013

局部敏感哈希的下限

研究了关于敏感哈希族的一些性质，证明了在 $L_1$ 度量空间中，不可能构造出一个性能与 Indyk 和 Motwani 相同的敏感哈希族。

Oct, 2005

通过张量化的随机投影来改进 LSH

提供了一种基于 CP 和 tensor train (TT) 分解技术的 LSH 方法，适用于欧几里得距离和余弦相似度的张量数据，具有空间高效性。

Feb, 2024

逼近近邻最优数据相关哈希

本文提出了一种基于数据的哈希方案，用于解决近似最近邻问题，对于 $n$ 个 $d$ 维数据集，我们的数据结构实现了查询时间 $O (d n^{ ho+o (1)})$ 和空间复杂度 $O (n^{1+ ho+o (1)}+dn)$，其中 $ ho= frac {1}{2c^2-1}$，而在 Hamming 空间中，我们获得了指数 $ ho= frac {1}{2c-1}$。此外，我们的结果比所有逼近因子 $c>1$ 的最佳 LSH 数据结构 [IM98, AI06] 更优。

Jan, 2015

最近邻搜索的学习空间划分

本研究提出一种新的框架用于构建空间划分，将问题转化为平衡图划分和监督分类，并结合 KaHIP 图分区器和神经网络，实现了一种新的分区过程称为神经局部敏感哈希（Neural LSH），实验证明 Neural LSH 的分区在标准最近邻搜索（NNS）基准测试中，始终优于基于量化和树的方法，以及经典的数据无关 LSH。

Jan, 2019

相似性搜索的快速谱排序

本研究介绍了一种显式嵌入方法，将流形搜索转化为欧氏距离搜索，并且利用近似傅里叶基础加速在线搜索，从而提高了特定对象的检索精度和效率。

Mar, 2017