NIPSNov, 2017

相似性估计和维度减少的实用哈希函数

TL;DR该论文研究了哈希在机器学习中降维的基本用途,比较了各种哈希方案的性能,主要关注该领域中的两个应用:相似度估计与特征哈希。作者发现 Dahlgaard 等人的混合制表哈希是一种在许多应用中表现良好的伪随机哈希函数,其性能与真随机哈希函数相似,比 MurmurHash3 快 40%。