基于动态连续索引的快速K最近邻搜索
使用紧凑的二进制编码表示图像数据和特征描述符的研究表明,多个哈希表可用于在 Hamming 空间中进行精确的 k 近邻搜索,并且在 64、128 或 256 位的十亿级数据集上,其运行时间呈子线性表现,从而实现了极大的速度提升。
Jul, 2013
本文提出了Optimized Cartesian $K$-Means(OCKM)方法,用于对高维数据进行编码以实现更准确的最近邻搜索,通过多个子码本中的多个子码字进行编码以提供更大的灵活性和更低的失真误差
May, 2014
本研究综述了基于哈希技术的ANN搜索的发展历程和应用,重点介绍了基于数据驱动学习方法和深度学习模型的哈希应用技术,分析了优缺点,并探讨了未来的研究趋势。
Sep, 2015
该研究介绍了一种名为优先的动态连续索引(Prioritized DCI)的变体,用于k近邻搜索,并且相对于现有方法(如局部敏感哈希, LSH),优先DCI通过线性增加空间而不是查询时间的依赖来解决了维数灾难的问题,并在内在维数方面展现了显着的改进。
Mar, 2017
本研究提出一种新的框架用于构建空间划分,将问题转化为平衡图划分和监督分类,并结合KaHIP图分区器和神经网络,实现了一种新的分区过程称为神经局部敏感哈希(Neural LSH),实验证明Neural LSH的分区在标准最近邻搜索(NNS)基准测试中,始终优于基于量化和树的方法,以及经典的数据无关LSH。
Jan, 2019
通过随机抽样和随机投影的组合,FastLSH算法将LSH计算的时间复杂度从O(n)降低到O(m)(其中m < n),并具有可证明的LSH属性,是一种有希望替代经典LSH方案的方法。
Sep, 2023
图形化相似最近邻搜索算法的最坏情况性能研究,以HNSW、NSG和DiskANN为例,发现其实际查询时间与实例大小成线性关系,并证明其具有常数近似比和多对数查询时间的边界维数据集。
Oct, 2023
近似k最近邻(ANN)方法常用于大规模高维数据集上的信息挖掘和机器学习,针对动态数据集和在线特征学习等应用,我们通过实证评估了5种流行的ANN方法,结果表明在动态数据集中,k-d树方法不适用,并且在在线数据收集和在线特征学习方面,层次可导航小世界图方法和可扩展最近邻方法分别比基线方法更快速。
Apr, 2024