Apr, 2024

动态数据集上的近似最近邻搜索:一项调查

TL;DR近似 k 最近邻(ANN)方法常用于大规模高维数据集上的信息挖掘和机器学习,针对动态数据集和在线特征学习等应用,我们通过实证评估了 5 种流行的 ANN 方法,结果表明在动态数据集中,k-d 树方法不适用,并且在在线数据收集和在线特征学习方面,层次可导航小世界图方法和可扩展最近邻方法分别比基线方法更快速。