Feb, 2024

带窗口过滤器的近似最近邻搜索

TL;DR我们定义和研究了 $ extit {c - 近似窗口搜索}$ 的问题,即在数据集中每个点具有数字标签,并且目标是在任意标签范围内找到 Queries 的最近邻。我们提出并理论分析了基于模块化树结构的方法,用于将解决传统 c - 近似最近邻问题的索引转换为解决窗口搜索的数据结构。在标准最近邻基准数据集上,对于具有随机标签值、对抗构建嵌入和具有实际时间戳的图像搜索嵌入,我们在相同召回级别上获得高达 75 倍的加速。