Jun, 2014

一种置换哈希方法的密集性改进

TL;DR本文提出了一种新的稠密化策略,使 $(K,L)$ 参数的局部敏感哈希 (Locality Sensitive Hashing) 的 minwise 哈希算法在查询处理成本上从 $O (dKL)$ 降至仅 $O (d + KL)$,针对非常稀疏的数据集,该改进的技术表现更好,并且在查询处理成本上与现有程序相同。