密度敏感哈希
使用紧凑的二进制编码表示图像数据和特征描述符的研究表明,多个哈希表可用于在 Hamming 空间中进行精确的 k 近邻搜索,并且在 64、128 或 256 位的十亿级数据集上,其运行时间呈子线性表现,从而实现了极大的速度提升。
Jul, 2013
本文提出了一种新的稠密化策略,使 $(K,L)$ 参数的局部敏感哈希 (Locality Sensitive Hashing)的 minwise 哈希算法在查询处理成本上从 $O(dKL)$ 降至仅 $O(d + KL)$,针对非常稀疏的数据集,该改进的技术表现更好,并且在查询处理成本上与现有程序相同。
Jun, 2014
本研究综述了基于哈希技术的ANN搜索的发展历程和应用,重点介绍了基于数据驱动学习方法和深度学习模型的哈希应用技术,分析了优缺点,并探讨了未来的研究趋势。
Sep, 2015
本文系统综述了最近邻搜索问题中的哈希学习算法,将其按照不同的相似性保存方式进行分类,并分别阐述其性能评估和效益分析,最终指出量化算法在搜索精度、搜索时间、空间花费等方面都表现优异,并介绍了一些新兴话题。
Jun, 2016
使用新的哈希函数族,开发第一个在设备上具有私密性、个性化和内存效率高的局部敏感哈希框架,实现了隐私和个性化,能够与其他LSH框架相竞争,训练大规模推荐网络。
Jun, 2023
本研究将差分隐私与一种名为OPH的子线性接近邻近搜索算法相结合,提出了DP-OPH框架,并通过实验比较DP-OPH与DP-MH的性能,同时将其技术扩展到非二进制数据的分类任务中。
Jun, 2023
通过随机抽样和随机投影的组合,FastLSH算法将LSH计算的时间复杂度从O(n)降低到O(m)(其中m < n),并具有可证明的LSH属性,是一种有希望替代经典LSH方案的方法。
Sep, 2023