相似性搜索的快速谱排序
本文介绍一种学习图嵌入的简单、有效方法,通过密集向量表示来近似节点之间的距离,以反映用户定义的图距离度量,避免了直接在图结构上进行操作引起的低效性,证明该方法在语义相似性和词义消歧任务上的表现比其他图嵌入方法更优秀,同时在 WordNet 和两个知识库图上进行了评估。
Jun, 2019
提出了一种新颖的算法,用于通过非线性嵌入向量到低维欧氏空间中进行监督判别距离学习,该方法可以被视为核神经网络,并且可以通过类似于线性 Mahalanobis 距离度量学习算法的近似核化得出,该方法的模型参数数量和测试时间评估复杂度均为 O (dD),其中 D 是输入特征的维度,d 是投影空间的维数,在具有数十万个训练对的 CNN 特征的数据集上进行了实证比较。
Sep, 2015
本文提出了一种基于相似度感知的谱图度规化框架,利用有效的谱离线嵌入和过滤方案构建保证谱相似度(相对条件数)水平的谱度规化器,并引入迭代图稠密化方案以促进高度病态问题的有效过滤。
Nov, 2017
本文提出了一种基于图遍历和压缩表征的方法,该方法编码可索引向量使用量化和利用图结构改进相似度估计。该方法在保证较小比较集的高精度及显著内存压缩的同时,在 64-128 字节每向量的操作点上,优于现有技术在二十亿规模公共基准测试中的表现。
Apr, 2018
分析了基于记忆的协同过滤方法中的相似性估算器的谱特性,说明 Pearson 和 cosine 相似性估算器中存在的噪声和特征值扩散问题,提出了一种简单的重新缩放和噪声清理方案,使基于记忆的方法表现更好。
May, 2019
本文提出了一种利用黎曼几何学习固定秩半正定矩阵流形的几何感知 SPD 相似性学习框架,通过在 PSD 流形中优化来学习具有判别性的 SPD 特征,优于现有的基于 SPD 的判别学习方法。
Aug, 2016
本文提出了一种优化 k - 选择算法解决高维数据相似度搜索问题的方法,实现了快速且准确的 k - 最近邻图的构建,并在多个方面超越目前的最新 GPU 技术。
Feb, 2017
本文提出了一种新的相似性学习框架,通过最小化核矩阵的重构误差,而不是现有的重构数据的误差,来提取相似性信息,并在聚类任务中展示了明显的改进,而且该框架为其它相似性任务提供了包括高维数据映射至低维空间在内的一种新的基础。
Mar, 2019
在化学中,最邻近基于相似性搜索是一项常见任务,但其中一些常用方法仍然采用蛮力算法。本研究评估了低维化学嵌入和 k-d 树数据结构相结合的方法,能在标准化学相似性搜索基准下实现快速最近邻查询,并证明了这种方法在超过十亿种化学物质的搜索中,仅用一个 CPU 核心能在一秒钟内执行,比蛮力算法快五个数量级,并且在化学相似性基准中表现出竞争性能。
Feb, 2024