Jun, 2014

一种置换哈希方法的密集性改进

TL;DR本文提出了一种新的稠密化策略,使 $(K,L)$ 参数的局部敏感哈希 (Locality Sensitive Hashing)的 minwise 哈希算法在查询处理成本上从 $O(dKL)$ 降至仅 $O(d + KL)$,针对非常稀疏的数据集,该改进的技术表现更好,并且在查询处理成本上与现有程序相同。