使用 GPU 进行快速 k 近邻搜索
本文提出了一种优化 k - 选择算法解决高维数据相似度搜索问题的方法,实现了快速且准确的 k - 最近邻图的构建,并在多个方面超越目前的最新 GPU 技术。
Feb, 2017
提出了一种利用全连接神经网络模型和支点来快速准确地估计查询的 k-NN 距离的机器学习技术。实验结果表明,该方法在大数据挖掘和近距离数据分析方面具有高效和有效的优势。
Aug, 2022
在此研究中,我们提出了 TrueKNN,这是第一种无界 RT 加速邻近搜索。TrueKNN 采用递增策略,在搜索空间逐步增加直到所有点都找到其 K 个邻居。我们发现,这种方法比现有方法快数个数量级,甚至可以用于加速固定半径邻近搜索。
May, 2023
本研究提出基于 Product Quantization 的两层向量量化树的 ANN 搜索新方法,在 GPU 实现方面取得了比 CPU 更高的性能表现,适用于视频中循环关闭等对时间敏感的高维问题。
Feb, 2017
提出一种新的无需数据空间分割的随机化算法来避免由于数据维度过高而导致的数据检索问题,并通过理论分析和实验结果来证明这种算法在数据近似性、速度和空间效率等方面优于传统的局部敏感哈希算法(LSH)
Dec, 2015
近似 k 最近邻(ANN)方法常用于大规模高维数据集上的信息挖掘和机器学习,针对动态数据集和在线特征学习等应用,我们通过实证评估了 5 种流行的 ANN 方法,结果表明在动态数据集中,k-d 树方法不适用,并且在在线数据收集和在线特征学习方面,层次可导航小世界图方法和可扩展最近邻方法分别比基线方法更快速。
Apr, 2024
该研究论文讨论了最近邻(NN)技术在模式识别、文本分类、目标识别等领域的应用。文中介绍了结构无关和结构相关技术,如加权 kNN,基于模型的 kNN 等结构无关技术以及 k-d 树,球树,主轴树,最近特征线,可调 NN 等结构相关算法,并提出了结构无关方法可以克服内存限制,而结构相关技术可以减少计算复杂度。
Jul, 2010
本研究针对深度学习在对抗性环境下的鲁棒性和预测不可解释性等问题,通过将 k-NN 算法与深度学习结合,提出了一种名为 DkNN 的混合分类器,它可以为输入数据提供信心估计和人类可解释的预测解释。实验证明,DkNN 算法可以准确识别模型外部的输入,同时提供直观和有用的模型失败解释。
Mar, 2018
该论文引入了 t-SNE-CUDA,它是一种 GPU 加速的 t 分布对称邻域嵌入(t-SNE)实现,用于可视化数据集和模型。t-SNE-CUDA 在图像和自然语言处理领域的数据集上实现了 50-700 倍的速度提升,从而实现了对整个 ImageNet 数据集的神经网络激活的可视化,并展示了 GloVe 嵌入向量的可视化效果。
Jul, 2018