Feb, 2023

随机投影森林中点分布对 k-nn 搜索的影响

TL;DR本文探讨了两种影响随机投影森林中 k - 最近邻搜索 (K-NN 搜索) 性能的因素(数据点的分散性和 rpForest 中树的数量),研究表明随机投影森林的数量较大时,数据点的分散性对 K-NN 搜索影响非常有限。因此,在选择随机方向时,应使用原始 rpTree 算法,而不考虑数据点的分散性。