基于热核的社区发现
论文提出了基于热核 PageRank 的两个新的本地图聚类算法 TEA 和 TEA+,利用确定性图遍历和蒙特卡洛随机游走的优化,解决了在大规模图上计算热核 PageRank 的效率低下的问题,并在真实世界的数据集上进行大量实验,表明 TEA + 在大多数基准数据集上的计算时间是同等聚类质量时现有算法的 4 倍以上。
Apr, 2019
本文提出了一种基于物理学的热核和 DropNode 技术生成时间图增量的方法,用于描述系统的演变行为;同时,还提出了 GDTW 动态时间包裹距离的方法,用于量化演化系统之间的距离,结果在真实世界的结构图数据集上的分类问题中,通过演化核方法获得了显著的分类准确率提高。
Jun, 2023
本文介绍了一种基于数据的方法,用于学习适应底层网络拓扑特征的类特定扩散函数,从而改善扩散分类器的性能并提高分类准确性,超过了依赖于节点嵌入和深度神经网络的最先进方法。
Apr, 2018
本文介绍了一种名为 GraphHeat 的方法用于对图结构数据进行半监督学习,并且能够在 Cora、Citeseer 和 Pubmed 数据集上取得最新颖的结果。
Jul, 2020
引入一种新的非确定性方法,将数据嵌入低维欧几里德空间,该方法基于依赖于数据几何的高斯过程的实现,通过计算高斯过程的实现来计算嵌入,其中高斯过程的协方差函数被取为热核函数,嵌入的直线距离以概率意义上逼近扩散距离,避免了对距离进行尖锐截断并保留了一定的较小尺度结构,此方法还具有对异常值的鲁棒性,并通过理论和实验证明了该方法的优势。
Mar, 2024
半监督分类的目标是基于所知少数节点(称为种子)的标签来为图的所有节点分配标签。本文证明了在计算得分之前需要对节点的温度进行居中处理,否则该算法是不一致的。这一关键步骤不仅使得算法在块模型上可以证明是一致的,还在实际图上带来了显著的性能提升。
Nov, 2023
该研究旨在通过发现 PageRank 参数与种子集扩展问题之间的联系,提出了一种评估排名方法的原则框架,并提出了一种简单的线性分类规则用于更高阶的落点概率的种子扩展问题。
Jul, 2016
通过扩展线性代数到再生核希尔伯特空间(RKHS)并将其简化为 Sylvester 方程的算法,我们构建了一个统一的框架来研究图形内核,这使得内核计算的时间复杂度从 O(n^6)降至 O(n^3),当图形稀疏时,共轭梯度求解器或固定点迭代带入子立方域。
Jul, 2008
本文提出了自动确定 Stochastic Blockmodel 所生成的图中聚类数的方法。通过剖析相应的邻接矩阵的主特征值限制分布并用于假设检验,提出了一个递归二分算法,该算法在真实世界的定量分类任务中表现优于现有概率模型,并且在未标记的网络中揭示出嵌套的社区结构。
Nov, 2013