Dec, 2019
流式数据的近似核密度估计子线性 RACE 草图
Sub-linear RACE Sketches for Approximate Kernel Density Estimation on Streaming Data
Benjamin Coleman, Anshumali Shrivastava
TL;DR提出 RACE 算法以取代高维数据的核密度估计,通过将一组高维向量压缩成一组整数计数器的小数组来实现。该方法可应用于实际的高维度数据集,相比其他方法具有 10 倍的压缩性能。