基于相似性测度的通用图嵌入
本文提出了一种新的网络嵌入方法LINE,用于将大规模的信息网络嵌入到低维向量空间中,实现了节点分类,链路预测等任务。该方法优化了一个经过精心设计的目标函数,可以保留本地和全局网络结构,并提出了边缘采样算法,改进了经典随机梯度下降的限制和推理效率。经验证明了LINE在包括语言网络、社交网络和引用网络在内的各种真实世界的信息网络上的有效性。对于单个典型机器,该算法非常高效,可以在数小时内学习具有数百万个顶点和数十亿个边的网络嵌入。
Mar, 2015
本文综述了图嵌入技术的各种方法,介绍了三个不同的分类方法的代表性算法,并分析了它们在不同任务上的表现。文章最终结论是提出了一些潜在的应用和未来方向,并介绍了一个名为GEM的Python库,其中提供了所有介绍的算法作为一个统一的接口,以促进和便利这个领域的研究。
May, 2017
本文介绍了一种新的条件网络嵌入方法,使用贝叶斯方法进行实现,本方法可以在一些网络结构较为复杂的情况下提高嵌入方法的表现,适用于网络的链接预测、多标记分类等任务,并且不增加计算复杂度。
May, 2018
本研究提出path2vec,一种学习图嵌入的新方法,它依赖于节点相似性的结构度量,该模型使用一个密集的空间来学习节点的表示,以逼近用户定义的图距离度量,并在语义相似性和词义消歧任务方面表现出色。
Aug, 2018
该研究利用语义特征来匹配所有节点对的文本序列,提出了一种单词对齐框架,并通过简单有效的聚合函数积累对齐特征。实验发现,该模型在链接预测和多标签节点分类等下游任务中具有很大的优越性。
Aug, 2018
本文介绍一种学习图嵌入的简单、有效方法,通过密集向量表示来近似节点之间的距离,以反映用户定义的图距离度量,避免了直接在图结构上进行操作引起的低效性,证明该方法在语义相似性和词义消歧任务上的表现比其他图嵌入方法更优秀,同时在WordNet和两个知识库图上进行了评估。
Jun, 2019
该论文提出了一个基于随机游走的图嵌入分析框架,包括三个组件:随机游走过程、相似性函数和嵌入算法,该框架不仅可以分类许多现有方法,而且自然地激发新方法,通过它,我们演示了改进下游任务性能的多个尺度嵌入的新方法。此外,我们还发现,基于自协方差相似性的嵌入,在与点积排名进行链路预测时,比基于点互信息相似性的最先进方法表现提高了多达100%。
Oct, 2021
本文研究图嵌入的质量以及其在社区检测方面的有效性,通过使用灵活的距离函数捕捉不同顶点之间的拓扑距离,将顶点嵌入作为距离矩阵的变换结果进行分析,并在多个基准数据集上进行评估。结果表明,该方法操作于降维表示,使得计算复杂度大为减少,且性能与传统算法相媲美。
Apr, 2024
该研究解决了文本图表示学习中有效提取结构和文本信息的不足。提出的节点级图自编码器(NodeGAE)框架,通过语言模型进行预训练并加入局部图结构的辅助损失,简化训练过程并提升了通用性。实验结果显示,该方法显著提高了多种图神经网络在节点分类和链接预测任务中的表现。
Aug, 2024
本研究解决了文本图表示学习中传统方法无法有效捕捉结构和文本信息的问题。提出了一种新的统一无监督学习框架节点级图自编码器(NodeGAE),通过语言模型进行预训练,并增加辅助损失项以关注局部图结构。实验结果表明,该方法显著提升了多种图神经网络在文本图数据集上的性能。
Aug, 2024