Apr, 2024

动态数据集上的近似最近邻搜索: 一项调查

TL;DR近似k最近邻(ANN)方法常用于大规模高维数据集上的信息挖掘和机器学习,针对动态数据集和在线特征学习等应用,我们通过实证评估了5种流行的ANN方法,结果表明在动态数据集中,k-d树方法不适用,并且在在线数据收集和在线特征学习方面,层次可导航小世界图方法和可扩展最近邻方法分别比基线方法更快速。