当异质性遇到异质性:新的图形基准和有效方法
本文综述了近年来异构图嵌入方法和技术的发展,并系统地归类了各种学习方法来解决异构性带来的挑战,探索了不同类型的应用中使用嵌入方法的可行性,总结了开源代码、现有的图学习平台和基准数据集,预测了未来的研究方向。
Nov, 2020
本文通过使用官方代码、数据集、设置和超参数,对12个最近的异质图神经网络进行了系统的复现,揭示了关于HGNNs进展的惊人发现。发现由于不当的设置,简单的同质GNNs被大大低估,GAT在适当的输入情况下可以在各种情况下与或胜过所有现有的HGNNs。为了促进鲁棒且可重复的HGNN研究,我们构建了异质图基准(HGB),其中包括具有三个任务的11个不同的数据集。HGB规范了异质图数据分割、特征处理和性能评估的流程。最后,我们介绍了一个简单但非常强大的基准Simple-HGN,它在HGB上明显优于所有先前的模型,以加速未来HGNNs的发展。
Dec, 2021
本研究旨在提高异质图神经网络(HGNN)在非同质化环境下的泛化能力,通过提出一种基于元路径的刻画异质图同质性度量方法,并设计了基于同质性的异质图重连方法HDHGR来提高HGNN的性能。实验证明HDHGR的有效性,可以获得10%以上的相对增益。
Feb, 2023
本文介绍了混合图(即高阶图)的统一定义以及混合图基准测试(HGB),并提供了可扩展的评估框架和支持代码库以方便在HGB 上训练和评估GNNs;我们的实证研究揭示了各种研究机会和空白。
Jun, 2023
利用元路径识别异质图中的异质性并提出了两个度量方法来定量描述异质性水平,在多个具有不同异质性水平的真实异质图上进行了深入研究,观察到继承自处理同质图的图神经网络对异质图的异质性或同质性较低的泛化能力有限。为解决这一挑战,提出了一种新的异质图神经网络 Hetero$^2$Net,通过蒙版元路径预测和蒙版标签预测任务,有效且灵活地处理同质性和异质性异质图,在五个具有不同异质性水平的真实异质图基准上评估了 Hetero$^2$Net 的性能,结果表明 Hetero$^2$Net 在半监督节点分类任务中优于强基线模型, 为有效处理更复杂的异质图提供了有价值的见解。
Oct, 2023
在异质性的情况下,图神经网络(GNNs)往往表现出次优的性能。本文提出并证明了异质性中宝贵的语义信息可以通过研究每个节点在图中的邻居分布来有效地利用于图学习,进而构建了一种新的图结构HiGNN,该结构通过利用节点分布来增强具有相似语义特征的节点之间的连接性。通过在节点分类任务上的实证评估和与其他方法比较,我们验证了HiGNN在改进图表示方面的有效性,并证明通过整合异质性信息可以显著提升现有基于GNN的方法,以及在真实世界数据集中的同质性程度,从而证明了我们方法的功效。
Mar, 2024
同质性原则(Homophily principle)是图神经网络(Graph Neural Networks)在图结构数据中表现优越的主要原因,但低同质性(heterophily)却是导致某些情况下图神经网络表现不理想的主要原因。本综述调查了异质图学习的最新进展,包括标杆数据集的详细概述、合成图上同质性度量的评估、最新监督和非监督学习方法的分类、同质性/异质性的理论分析以及与异质性相关的广泛应用。同时,我们首次将标杆的异质性数据集分为恶性、良性和模糊三个子类,其中恶性和模糊数据集是用于测试新模型在异质性挑战上有效性的真正具有挑战性的数据集。最后,我们提出了几个关于异质图表示学习的挑战和未来方向。
Jul, 2024
本研究针对无监督异质图表示学习(UHGRL)中的异质性问题进行探索,尤其是语义异质性在实际图中普遍存在但被忽视。提出的潜在图引导无监督表示学习(LatGRL)框架结合全局结构和属性进行相似性挖掘,构建细粒度的同质和异质潜在图以指导表示学习,显著提升了节点级语义异质性的处理能力。实验结果表明该框架在真实数据的大规模应用中有效且高效。
Sep, 2024