Dec, 2019

流式数据的近似核密度估计子线性 RACE 草图

TL;DR提出 RACE 算法以取代高维数据的核密度估计,通过将一组高维向量压缩成一组整数计数器的小数组来实现。该方法可应用于实际的高维度数据集,相比其他方法具有 10 倍的压缩性能。