Marius: 在单机上学习大规模图嵌入
通过对现有的图嵌入系统进行多方面调整,将图划分为更小的子图进行处理,我们提出了创新型的 PyTorch-BigGraph (PBG) 嵌入系统,其可以扩展到包含数十亿个节点和万亿条边的图谱,使得我们能够对大型社交网络图和 Freebase 数据集等各种大型图谱进行分布式处理和大规模分析。
Mar, 2019
开发了一种基于 DASK、Pytorch Lightning 和 Hugging Face 框架的知识图谱嵌入计算框架,能够以硬件无关的方式计算大规模知识图谱的嵌入表示,并提供了一个开源版本的框架以及一个具有超过 11.4B 参数的预训练模型的集线器。
Jul, 2022
本文提出了 MultI-Level Embedding (MILE) 框架,使用混合匹配技术将大型图形渐进细化为规模较小的图形,然后使用现有图嵌入方法对最粗略的图形进行嵌入,并通过学习的图卷积神经网络将嵌入细化到原始图形上,以实现图形嵌入在节点分类任务中的计算速度提升和嵌入质量优化,并且可以轻松地适用于具有数百万节点和数十万边的大型图形。
Feb, 2018
提出一种新的图级表示学习方法 —— 将整个图形嵌入到一个向量空间中,其中两个图形的嵌入保持其图形 - 图形的关联性。UGRAPHEMB 是一种通用框架,提供了一种全面的无监督和归纳式图级嵌入方法。 通过多尺度节点关注(MSNA)提出一种新的图级嵌入生成机制。在五个真实图形数据集上进行的实验表明,UGRAPHEMB 在图分类、相似性排名和图形可视化任务中具有竞争力的准确性。
Apr, 2019
本文介绍一种学习图嵌入的简单、有效方法,通过密集向量表示来近似节点之间的距离,以反映用户定义的图距离度量,避免了直接在图结构上进行操作引起的低效性,证明该方法在语义相似性和词义消歧任务上的表现比其他图嵌入方法更优秀,同时在 WordNet 和两个知识库图上进行了评估。
Jun, 2019
DGL-KE 是一个开源的知识图谱嵌入计算软件包,采用多进程、多 GPU 和分布式并行化等各种创新优化,可以在 8 个 GPU 的 EC2 实例上的 100 分钟内计算出 8600 万节点和 3.38 亿边的知识图谱的嵌入,比其他竞争方法快 2 至 5 倍。
Apr, 2020
图嵌入是网络理解的常用方法,本论文提出了一种基于 Tensor Processing Units 的高性能图嵌入架构,能够解决大规模图的嵌入问题,并通过真实和合成的大规模数据集验证了嵌入空间的质量。
Jul, 2023
通过使用压缩方法,我们可以将节点嵌入用比浮点向量更紧凑的向量表示,从而实现在工业级规模的图形数据上快速训练图神经网络,同时达到更好的性能。
Aug, 2022
本文提出了一个高性能的 CPU-GPU 混合系统 GraphVite,采用在线随机游走并行生成扩展边样本的方式,在 GPU 端采用一种新颖的并行负采样,为大规模网络训练节点嵌入提供了有效途径。在多个真实网络上的实验结果表明,GraphVite 不仅效率高,而且相比现有最快的系统,更快 50 倍而且性能没有损失。
Mar, 2019